Форум: "Базы";
Текущий архив: 2003.04.14;
Скачать: [xml.tar.bz2];
ВнизОтбор записей в справочник Найти похожие ветки
← →
Жук (2003-03-25 08:21) [0]Существует таблица Ёксель, одно из полей которой - список фирм. Нужно организовать в IB справочник по этим данным. Но проблема в том, что написание названия фирмы встречается в нескольких вариантах (например Пив.комп."Балтика" - 15 вариантов). Что можно предпринять ? Посоветуйте, плз.
← →
_Shade (2003-03-25 09:14) [1]Завести справочник синонимов.
← →
Жук (2003-03-25 09:16) [2]
> _Shade (25.03.03 09:14)
> Завести справочник синонимов.
А поподробнее ?
← →
Жук (2003-03-25 09:21) [3]Конечно можно тупо отбирать все записи, которых ещё нет в справочнике, а потом синонимы погрохать, но всё-таке хочется енто как-то автоматизировать.
← →
Johnmen (2003-03-25 09:21) [4]Самое правильное - определиться однозначно с единственным вариантом наименования и руками все подогнать под него...
← →
_Shade (2003-03-25 09:24) [5]Ну, например, так.
либо 2 справочника:
1.) Table1(ID, Name), Table2(ParentID, Name)
в Table1 - родительское название
в Table2 - синонимы с "родительским" ID
либо: иерархическая таблица Table(ID, Name, ParentID)
ID - ID "родителя", основное название (в случае потомка =0).
ParentID - ссылка на ID.
← →
Johnmen (2003-03-25 09:27) [6]Практика показывает, что даже самые продвинутые и специализированные алгоритмы способны отследить не более 80% синонимов.
← →
Жук (2003-03-25 09:29) [7]Хотя бы такой процент
> Практика показывает, что даже самые продвинутые и специализированные
> алгоритмы способны отследить не более 80% синонимов.
Хотя бы такой процент меня устроил. :-)
← →
Жук (2003-03-25 09:32) [8]
> _Shade (25.03.03 09:24)
Как узнать, что запись - потомок к.-н. родителя ?
← →
Johnmen (2003-03-25 09:38) [9]Ну и придумай свои правила/алгоритм определения синонимов...:)
Но времени это может занять несоразмерно более, чем руками.
Лично я сделал бы именно руками, если задача перегонки однократна...
← →
Sergey13 (2003-03-25 09:39) [10]2Жук © (25.03.03 09:32)
ИМХО, только ручками. На "автоматизацию" уйдет больше времени и средств а 100% уверенности в конечном результате все равно не будет, опять же ИМХО.
← →
Жук (2003-03-25 09:41) [11]Такой уж я лентяй. :-(
Сижу - пишу фильтр, но может готовые агоритмы кто знает ?
← →
Anatoly Podgoretsky (2003-03-25 09:45) [12]Жук © (25.03.03 08:21)
Заняться организацией турда в фирме, поскольку подобная ситуация безумная трата средств. Ответственные за ввод данных должны отвечать материально - действует эффективно.
Для устранения конфликтов должно быть поле - кто занес данные в справочник. Данние исправлять и удалять только специальными процедурами.
← →
_Shade (2003-03-25 12:08) [13]2Жук: в каком случае?
2 A.Podgoretsky
Насчёт определения стандарта :
А если некого привлекать? Если источник данных нельзя регламентировать, по причине его полной вам неподконтрольности?
Напр., собираете статистику с предприятий какого-либо профиля и на каждом из них свой стандарт и никто не будет его перекраивать по вашему желанию. В этом случае, справочник представляется единственно приемлимым решением на мой взгляд.
Может быть, кто сталкивался с такой проблемой, поделятся опытом?
Прошу прощения за оффтопик.
← →
tomkat (2003-03-25 14:35) [14]заведи идентификатор !
например , код чего угодно , что было бы едино для всех ...
к примеру, на Украине есть ЕГРПОУ (Единый гос. реестр предприятий организаций Украины), каждому предприятию присвоен свой уникальный код , а какое там название - тебе начихать должно быть ....
потом сгруппируеш по коду и все !
← →
Жук (2003-03-25 14:46) [15]
> tomkat © (25.03.03 14:35)
> заведи идентификатор !
Дело в том, что "Городской хлебокомбинат" и "Городской х/к" - это одно и то же. А чтобы им проставить один идентификатор, надо сначала определить, что это разные названия одного предприятия. А это - бо-ольшая проблема.
← →
Соловьев (2003-03-25 14:48) [16]
> Жук © (25.03.03 09:41)
> Такой уж я лентяй. :-(
> Сижу - пишу фильтр, но может готовые агоритмы кто знает
> ?
Johnmen © (25.03.03 09:27) прав. 80% а то итого меньше. Лучше посадить Маню, которая приведет в нормальный вид. Сам я тоже с этим сталкивался, тоже неоднократно приходилось переганять данные. Тоже писал фильтр, алгоритм. В итоге потратил время за которое Маня все бы сделала. Но Маня тоже может напортачить, например, ввести аналоги русским буквам - английские, и сиди потом разбирайся... В конечном итоге прошло пару месяцев, и данные вносили в уже новую БД...
← →
alex_bredin (2003-03-25 14:49) [17]Больной вопрос.
Я решал так, как предлагает Шаде.
_Shade (25.03.03 09:24)
Определяешь таблицу соответствия только вручную-какие могут быть алгоритмы, если существует бесконечное мн-во вариантов определения(не забывать об аббревиатурах), отследить которые в состоянии только человек.
← →
REP (2003-03-26 06:53) [18]А в спавочнике только названия?
ИНН нету? Он же уникальный
Страницы: 1 вся ветка
Форум: "Базы";
Текущий архив: 2003.04.14;
Скачать: [xml.tar.bz2];
Память: 0.48 MB
Время: 0.009 c