Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2003.04.14;
Скачать: CL | DM;

Вниз

Отбор записей в справочник   Найти похожие ветки 

 
Жук ©   (2003-03-25 08:21) [0]

Существует таблица Ёксель, одно из полей которой - список фирм. Нужно организовать в IB справочник по этим данным. Но проблема в том, что написание названия фирмы встречается в нескольких вариантах (например Пив.комп."Балтика" - 15 вариантов). Что можно предпринять ? Посоветуйте, плз.


 
_Shade   (2003-03-25 09:14) [1]

Завести справочник синонимов.


 
Жук ©   (2003-03-25 09:16) [2]


> _Shade (25.03.03 09:14)
> Завести справочник синонимов.
А поподробнее ?


 
Жук ©   (2003-03-25 09:21) [3]

Конечно можно тупо отбирать все записи, которых ещё нет в справочнике, а потом синонимы погрохать, но всё-таке хочется енто как-то автоматизировать.


 
Johnmen ©   (2003-03-25 09:21) [4]

Самое правильное - определиться однозначно с единственным вариантом наименования и руками все подогнать под него...


 
_Shade   (2003-03-25 09:24) [5]

Ну, например, так.
либо 2 справочника:
1.) Table1(ID, Name), Table2(ParentID, Name)
в Table1 - родительское название
в Table2 - синонимы с "родительским" ID
либо: иерархическая таблица Table(ID, Name, ParentID)
ID - ID "родителя", основное название (в случае потомка =0).
ParentID - ссылка на ID.


 
Johnmen ©   (2003-03-25 09:27) [6]

Практика показывает, что даже самые продвинутые и специализированные алгоритмы способны отследить не более 80% синонимов.


 
Жук ©   (2003-03-25 09:29) [7]

Хотя бы такой процент
> Практика показывает, что даже самые продвинутые и специализированные
> алгоритмы способны отследить не более 80% синонимов.

Хотя бы такой процент меня устроил. :-)


 
Жук ©   (2003-03-25 09:32) [8]


> _Shade (25.03.03 09:24)

Как узнать, что запись - потомок к.-н. родителя ?


 
Johnmen ©   (2003-03-25 09:38) [9]

Ну и придумай свои правила/алгоритм определения синонимов...:)
Но времени это может занять несоразмерно более, чем руками.
Лично я сделал бы именно руками, если задача перегонки однократна...


 
Sergey13 ©   (2003-03-25 09:39) [10]

2Жук © (25.03.03 09:32)
ИМХО, только ручками. На "автоматизацию" уйдет больше времени и средств а 100% уверенности в конечном результате все равно не будет, опять же ИМХО.


 
Жук ©   (2003-03-25 09:41) [11]

Такой уж я лентяй. :-(
Сижу - пишу фильтр, но может готовые агоритмы кто знает ?


 
Anatoly Podgoretsky ©   (2003-03-25 09:45) [12]

Жук © (25.03.03 08:21)
Заняться организацией турда в фирме, поскольку подобная ситуация безумная трата средств. Ответственные за ввод данных должны отвечать материально - действует эффективно.
Для устранения конфликтов должно быть поле - кто занес данные в справочник. Данние исправлять и удалять только специальными процедурами.


 
_Shade   (2003-03-25 12:08) [13]

2Жук: в каком случае?
2 A.Podgoretsky
Насчёт определения стандарта :
А если некого привлекать? Если источник данных нельзя регламентировать, по причине его полной вам неподконтрольности?
Напр., собираете статистику с предприятий какого-либо профиля и на каждом из них свой стандарт и никто не будет его перекраивать по вашему желанию. В этом случае, справочник представляется единственно приемлимым решением на мой взгляд.
Может быть, кто сталкивался с такой проблемой, поделятся опытом?
Прошу прощения за оффтопик.


 
tomkat ©   (2003-03-25 14:35) [14]

заведи идентификатор !
например , код чего угодно , что было бы едино для всех ...
к примеру, на Украине есть ЕГРПОУ (Единый гос. реестр предприятий организаций Украины), каждому предприятию присвоен свой уникальный код , а какое там название - тебе начихать должно быть ....
потом сгруппируеш по коду и все !


 
Жук ©   (2003-03-25 14:46) [15]


> tomkat © (25.03.03 14:35)
> заведи идентификатор !

Дело в том, что "Городской хлебокомбинат" и "Городской х/к" - это одно и то же. А чтобы им проставить один идентификатор, надо сначала определить, что это разные названия одного предприятия. А это - бо-ольшая проблема.


 
Соловьев ©   (2003-03-25 14:48) [16]


> Жук © (25.03.03 09:41)
> Такой уж я лентяй. :-(
> Сижу - пишу фильтр, но может готовые агоритмы кто знает
> ?

Johnmen © (25.03.03 09:27) прав. 80% а то итого меньше. Лучше посадить Маню, которая приведет в нормальный вид. Сам я тоже с этим сталкивался, тоже неоднократно приходилось переганять данные. Тоже писал фильтр, алгоритм. В итоге потратил время за которое Маня все бы сделала. Но Маня тоже может напортачить, например, ввести аналоги русским буквам - английские, и сиди потом разбирайся... В конечном итоге прошло пару месяцев, и данные вносили в уже новую БД...



 
alex_bredin ©   (2003-03-25 14:49) [17]

Больной вопрос.
Я решал так, как предлагает Шаде.
_Shade (25.03.03 09:24)
Определяешь таблицу соответствия только вручную-какие могут быть алгоритмы, если существует бесконечное мн-во вариантов определения(не забывать об аббревиатурах), отследить которые в состоянии только человек.


 
REP ©   (2003-03-26 06:53) [18]

А в спавочнике только названия?
ИНН нету? Он же уникальный



Страницы: 1 вся ветка

Текущий архив: 2003.04.14;
Скачать: CL | DM;

Наверх




Память: 0.51 MB
Время: 0.02 c
6-44309
imp403
2003-02-20 00:43
2003.04.14
IdTelnet


14-44355
MVova
2003-03-31 10:40
2003.04.14
А почему здесь нет подсчета просмотров вопроса?


8-44280
__Alx__
2003-01-11 15:06
2003.04.14
Как работать с большим изображением?


14-44434
Merlin
2003-03-28 13:42
2003.04.14
Переезд сайта


14-44423
cd1
2003-03-28 16:22
2003.04.14
FastReport 2.47