Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Базы";
Текущий архив: 2005.01.23;
Скачать: [xml.tar.bz2];

Вниз

Носовпадение двух символов   Найти похожие ветки 

 
Evyshka   (2004-12-18 10:30) [0]

Даны две таблицы table1: fam1, Im1, Ot1, Dr1
и вторая Table2: fam2, Im2, Ot2, Dr2
Надо выбрать людей из таблицы 1 , которые есть в таблице 2 с точностью до двух символов по полю fam то есть если в Table1 есть Иванов Иван Иванович, 01.01.2001 а во второй Ивонов Иван Иванович, 01.01.2001 то запись считать найденной (несовпадающие символы могут стоять в любом месте)


 
Fin ©   (2004-12-18 10:59) [1]

Самый простой способ в цикле перебирать первую таблицу и также в цикле каждую запись из первой таблицы сравнивать со второй таблицей, предварительно обрезав лишние символы, а результат помещать во временную таблицу. Но при этом возникает вопрос если в первой таблице есть (Иванов Иван Иванович, 01.01.2001), а во второй (Иванов Иван Иванович, 01.01.2001) и (Ивонов Иван Иванович, 01.01.2001) кого выберешь или обоих?


 
DenK_vrtz ©   (2004-12-18 11:01) [2]

Сразу напрашиваются несколько вопросов.
Почему две таблицы?
Почему не сделать справочник типа "Персонал"?

>Надо выбрать людей из таблицы 1 , которые есть в таблице 2 с точностью до двух символов...

и тут же
>а во второй Ивонов Иван Иванович, 01.01.2001 то запись считать найденной


 
Evyshka   (2004-12-18 11:03) [3]

Полные совпадения уже исключены из таблицы, то есть заведомо известно сто во второй таблице Иванов Иван Иванович, 01.01.2001 не будет


 
Evyshka   (2004-12-18 11:04) [4]

DenK_vrtz © - нужно именно сравнее двух разных таюлиц


 
Fin ©   (2004-12-18 11:08) [5]

Ну и как сказал в циклах перебирай записи. Только что если встретиться так table1 (Иванов Иван Иванович, 01.01.2001)? а во второй (Ивашкин Иван Иванович, 01.01.2001) и что тогда?


 
Evyshka   (2004-12-18 11:13) [6]

Ивашкин уже 3 символа :-))


 
Fin ©   (2004-12-18 11:15) [7]

Причем тут з символа, по условию первые два и так совпадут, ну если хочешь будет Ивошкин....


 
Evyshka   (2004-12-18 11:18) [8]

Fin © последняя фраза в субботнее утро доходит с трудом :-)))


 
Fin ©   (2004-12-18 11:23) [9]

Про [8] скажу аналогично.
И поясняю если в первой таблице (Иванов Иван Иванович, 01.01.2001)? а во второй (Ивошкин Иван Иванович, 01.01.2001) и что тогда?


 
Evyshka   (2004-12-18 11:30) [10]

Ивошкина не брать это точно Может тогда еще и длину проверять?


 
Fin ©   (2004-12-18 11:36) [11]

Проверка длинны может еще и ухудшить, если предположим во второй таблице введено (Ивнов)в смысле ошибочно пропушена буква (а)
Наиболее простой вариант во временную таблицу выкидывать все малол мальски удовлетворяющие записи, а потом глазками просматривать и вручную принимать решение.


 
Evyshka   (2004-12-18 11:39) [12]

Фигово Надеялась на более утешительный вариант каким нибудь суперовским запросом :-))


 
Evyshka   (2004-12-18 11:40) [13]

Фигово Надеялась на более утешительный вариант каким нибудь суперовским запросом :-))


 
Fin ©   (2004-12-18 11:44) [14]

Мне каждый месяц приходитья проверять до 50000 строк при этом необходимо учитывать регистр букв, опечатки, случайное использование латинских букв похожих на кириллицу, а таже адреса, и еще ряд параметров и на конечном этапе всеравно наиболее подозрительные моменты просматриваются глазами. Выход позволяющий решить проблемму уникальный идентификатор для человека, что то вроде ИНН.


 
Evyshka   (2004-12-18 11:48) [15]

нет это таблицы разных организаций так что с идентификатором сложно так как все поступающие форматы определены


 
Fin ©   (2004-12-18 11:50) [16]

В моем случае тоже разные таблицы и тоже от разных организаций, а по поводу уникального идентификатора - это мечты.


 
Evyshka   (2004-12-18 11:54) [17]

а может мы сравниваем одно и то же :-)))


 
Fin ©   (2004-12-18 11:56) [18]

Лично я сравниваю Льготников.


 
Evyshka   (2004-12-18 11:57) [19]

я тоже :-))))


 
Evyshka   (2004-12-18 11:58) [20]

какие результаты у меня 4 % несовпадений


 
Fin ©   (2004-12-18 11:59) [21]

Мир тесен...


 
Anatoly Podgoretsky ©   (2004-12-18 12:02) [22]

Тут и искуственный и естественный интеллекты не помогут.


 
Fin ©   (2004-12-18 12:04) [23]

Ну не знаю как в процентах лень вычислять а натуральных единицах из 45000-50000 в среднем 50-100 не совпадений.


 
Fin ©   (2004-12-18 12:06) [24]

Anatoly Podgoretsky конечно не помогут, а делать все равно надо, и как то делаем.



Страницы: 1 вся ветка

Форум: "Базы";
Текущий архив: 2005.01.23;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.49 MB
Время: 0.04 c
1-1105364591
snake_r
2005-01-10 16:43
2005.01.23
TImage


14-1104476437
КаПиБаРа
2004-12-31 10:00
2005.01.23
Кто чем занимается перед новым годом?


1-1105425565
Registered Guest
2005-01-11 09:39
2005.01.23
Как найти самое длинное слово в тексте?


14-1104810577
DelphiN!
2005-01-04 06:49
2005.01.23
Где скачать все выпуски RSDN Magazine ?


1-1104859779
Кодер
2005-01-04 20:29
2005.01.23
Мерцание компонент





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский