Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Базы";
Текущий архив: 2003.04.14;
Скачать: [xml.tar.bz2];

Вниз

Отбор записей в справочник   Найти похожие ветки 

 
Жук   (2003-03-25 08:21) [0]

Существует таблица Ёксель, одно из полей которой - список фирм. Нужно организовать в IB справочник по этим данным. Но проблема в том, что написание названия фирмы встречается в нескольких вариантах (например Пив.комп."Балтика" - 15 вариантов). Что можно предпринять ? Посоветуйте, плз.


 
_Shade   (2003-03-25 09:14) [1]

Завести справочник синонимов.


 
Жук   (2003-03-25 09:16) [2]


> _Shade (25.03.03 09:14)
> Завести справочник синонимов.
А поподробнее ?


 
Жук   (2003-03-25 09:21) [3]

Конечно можно тупо отбирать все записи, которых ещё нет в справочнике, а потом синонимы погрохать, но всё-таке хочется енто как-то автоматизировать.


 
Johnmen   (2003-03-25 09:21) [4]

Самое правильное - определиться однозначно с единственным вариантом наименования и руками все подогнать под него...


 
_Shade   (2003-03-25 09:24) [5]

Ну, например, так.
либо 2 справочника:
1.) Table1(ID, Name), Table2(ParentID, Name)
в Table1 - родительское название
в Table2 - синонимы с "родительским" ID
либо: иерархическая таблица Table(ID, Name, ParentID)
ID - ID "родителя", основное название (в случае потомка =0).
ParentID - ссылка на ID.


 
Johnmen   (2003-03-25 09:27) [6]

Практика показывает, что даже самые продвинутые и специализированные алгоритмы способны отследить не более 80% синонимов.


 
Жук   (2003-03-25 09:29) [7]

Хотя бы такой процент
> Практика показывает, что даже самые продвинутые и специализированные
> алгоритмы способны отследить не более 80% синонимов.

Хотя бы такой процент меня устроил. :-)


 
Жук   (2003-03-25 09:32) [8]


> _Shade (25.03.03 09:24)

Как узнать, что запись - потомок к.-н. родителя ?


 
Johnmen   (2003-03-25 09:38) [9]

Ну и придумай свои правила/алгоритм определения синонимов...:)
Но времени это может занять несоразмерно более, чем руками.
Лично я сделал бы именно руками, если задача перегонки однократна...


 
Sergey13   (2003-03-25 09:39) [10]

2Жук © (25.03.03 09:32)
ИМХО, только ручками. На "автоматизацию" уйдет больше времени и средств а 100% уверенности в конечном результате все равно не будет, опять же ИМХО.


 
Жук   (2003-03-25 09:41) [11]

Такой уж я лентяй. :-(
Сижу - пишу фильтр, но может готовые агоритмы кто знает ?


 
Anatoly Podgoretsky   (2003-03-25 09:45) [12]

Жук © (25.03.03 08:21)
Заняться организацией турда в фирме, поскольку подобная ситуация безумная трата средств. Ответственные за ввод данных должны отвечать материально - действует эффективно.
Для устранения конфликтов должно быть поле - кто занес данные в справочник. Данние исправлять и удалять только специальными процедурами.


 
_Shade   (2003-03-25 12:08) [13]

2Жук: в каком случае?
2 A.Podgoretsky
Насчёт определения стандарта :
А если некого привлекать? Если источник данных нельзя регламентировать, по причине его полной вам неподконтрольности?
Напр., собираете статистику с предприятий какого-либо профиля и на каждом из них свой стандарт и никто не будет его перекраивать по вашему желанию. В этом случае, справочник представляется единственно приемлимым решением на мой взгляд.
Может быть, кто сталкивался с такой проблемой, поделятся опытом?
Прошу прощения за оффтопик.


 
tomkat   (2003-03-25 14:35) [14]

заведи идентификатор !
например , код чего угодно , что было бы едино для всех ...
к примеру, на Украине есть ЕГРПОУ (Единый гос. реестр предприятий организаций Украины), каждому предприятию присвоен свой уникальный код , а какое там название - тебе начихать должно быть ....
потом сгруппируеш по коду и все !


 
Жук   (2003-03-25 14:46) [15]


> tomkat © (25.03.03 14:35)
> заведи идентификатор !

Дело в том, что "Городской хлебокомбинат" и "Городской х/к" - это одно и то же. А чтобы им проставить один идентификатор, надо сначала определить, что это разные названия одного предприятия. А это - бо-ольшая проблема.


 
Соловьев   (2003-03-25 14:48) [16]


> Жук © (25.03.03 09:41)
> Такой уж я лентяй. :-(
> Сижу - пишу фильтр, но может готовые агоритмы кто знает
> ?

Johnmen © (25.03.03 09:27) прав. 80% а то итого меньше. Лучше посадить Маню, которая приведет в нормальный вид. Сам я тоже с этим сталкивался, тоже неоднократно приходилось переганять данные. Тоже писал фильтр, алгоритм. В итоге потратил время за которое Маня все бы сделала. Но Маня тоже может напортачить, например, ввести аналоги русским буквам - английские, и сиди потом разбирайся... В конечном итоге прошло пару месяцев, и данные вносили в уже новую БД...



 
alex_bredin   (2003-03-25 14:49) [17]

Больной вопрос.
Я решал так, как предлагает Шаде.
_Shade (25.03.03 09:24)
Определяешь таблицу соответствия только вручную-какие могут быть алгоритмы, если существует бесконечное мн-во вариантов определения(не забывать об аббревиатурах), отследить которые в состоянии только человек.


 
REP   (2003-03-26 06:53) [18]

А в спавочнике только названия?
ИНН нету? Он же уникальный



Страницы: 1 вся ветка

Форум: "Базы";
Текущий архив: 2003.04.14;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.48 MB
Время: 0.007 c
14-44355
MVova
2003-03-31 10:40
2003.04.14
А почему здесь нет подсчета просмотров вопроса?


1-44193
Reistlyn
2003-04-01 14:52
2003.04.14
Удаление данных из файла.


14-44427
qwantum
2003-03-26 10:53
2003.04.14
k6-2 450 vs p233mmx


7-44465
Mehal'
2003-02-18 15:45
2003.04.14
Как напечатать содержимое WebBrowser ???


1-44261
RoadStar
2003-04-02 14:31
2003.04.14
Сигнализация выхода из приложения





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский