Форум: "Базы";
Текущий архив: 2005.01.23;
Скачать: [xml.tar.bz2];
ВнизНосовпадение двух символов Найти похожие ветки
← →
Evyshka (2004-12-18 10:30) [0]Даны две таблицы table1: fam1, Im1, Ot1, Dr1
и вторая Table2: fam2, Im2, Ot2, Dr2
Надо выбрать людей из таблицы 1 , которые есть в таблице 2 с точностью до двух символов по полю fam то есть если в Table1 есть Иванов Иван Иванович, 01.01.2001 а во второй Ивонов Иван Иванович, 01.01.2001 то запись считать найденной (несовпадающие символы могут стоять в любом месте)
← →
Fin © (2004-12-18 10:59) [1]Самый простой способ в цикле перебирать первую таблицу и также в цикле каждую запись из первой таблицы сравнивать со второй таблицей, предварительно обрезав лишние символы, а результат помещать во временную таблицу. Но при этом возникает вопрос если в первой таблице есть (Иванов Иван Иванович, 01.01.2001), а во второй (Иванов Иван Иванович, 01.01.2001) и (Ивонов Иван Иванович, 01.01.2001) кого выберешь или обоих?
← →
DenK_vrtz © (2004-12-18 11:01) [2]Сразу напрашиваются несколько вопросов.
Почему две таблицы?
Почему не сделать справочник типа "Персонал"?
>Надо выбрать людей из таблицы 1 , которые есть в таблице 2 с точностью до двух символов...
и тут же
>а во второй Ивонов Иван Иванович, 01.01.2001 то запись считать найденной
← →
Evyshka (2004-12-18 11:03) [3]Полные совпадения уже исключены из таблицы, то есть заведомо известно сто во второй таблице Иванов Иван Иванович, 01.01.2001 не будет
← →
Evyshka (2004-12-18 11:04) [4]DenK_vrtz © - нужно именно сравнее двух разных таюлиц
← →
Fin © (2004-12-18 11:08) [5]Ну и как сказал в циклах перебирай записи. Только что если встретиться так table1 (Иванов Иван Иванович, 01.01.2001)? а во второй (Ивашкин Иван Иванович, 01.01.2001) и что тогда?
← →
Evyshka (2004-12-18 11:13) [6]Ивашкин уже 3 символа :-))
← →
Fin © (2004-12-18 11:15) [7]Причем тут з символа, по условию первые два и так совпадут, ну если хочешь будет Ивошкин....
← →
Evyshka (2004-12-18 11:18) [8]Fin © последняя фраза в субботнее утро доходит с трудом :-)))
← →
Fin © (2004-12-18 11:23) [9]Про [8] скажу аналогично.
И поясняю если в первой таблице (Иванов Иван Иванович, 01.01.2001)? а во второй (Ивошкин Иван Иванович, 01.01.2001) и что тогда?
← →
Evyshka (2004-12-18 11:30) [10]Ивошкина не брать это точно Может тогда еще и длину проверять?
← →
Fin © (2004-12-18 11:36) [11]Проверка длинны может еще и ухудшить, если предположим во второй таблице введено (Ивнов)в смысле ошибочно пропушена буква (а)
Наиболее простой вариант во временную таблицу выкидывать все малол мальски удовлетворяющие записи, а потом глазками просматривать и вручную принимать решение.
← →
Evyshka (2004-12-18 11:39) [12]Фигово Надеялась на более утешительный вариант каким нибудь суперовским запросом :-))
← →
Evyshka (2004-12-18 11:40) [13]Фигово Надеялась на более утешительный вариант каким нибудь суперовским запросом :-))
← →
Fin © (2004-12-18 11:44) [14]Мне каждый месяц приходитья проверять до 50000 строк при этом необходимо учитывать регистр букв, опечатки, случайное использование латинских букв похожих на кириллицу, а таже адреса, и еще ряд параметров и на конечном этапе всеравно наиболее подозрительные моменты просматриваются глазами. Выход позволяющий решить проблемму уникальный идентификатор для человека, что то вроде ИНН.
← →
Evyshka (2004-12-18 11:48) [15]нет это таблицы разных организаций так что с идентификатором сложно так как все поступающие форматы определены
← →
Fin © (2004-12-18 11:50) [16]В моем случае тоже разные таблицы и тоже от разных организаций, а по поводу уникального идентификатора - это мечты.
← →
Evyshka (2004-12-18 11:54) [17]а может мы сравниваем одно и то же :-)))
← →
Fin © (2004-12-18 11:56) [18]Лично я сравниваю Льготников.
← →
Evyshka (2004-12-18 11:57) [19]я тоже :-))))
← →
Evyshka (2004-12-18 11:58) [20]какие результаты у меня 4 % несовпадений
← →
Fin © (2004-12-18 11:59) [21]Мир тесен...
← →
Anatoly Podgoretsky © (2004-12-18 12:02) [22]Тут и искуственный и естественный интеллекты не помогут.
← →
Fin © (2004-12-18 12:04) [23]Ну не знаю как в процентах лень вычислять а натуральных единицах из 45000-50000 в среднем 50-100 не совпадений.
← →
Fin © (2004-12-18 12:06) [24]Anatoly Podgoretsky конечно не помогут, а делать все равно надо, и как то делаем.
Страницы: 1 вся ветка
Форум: "Базы";
Текущий архив: 2005.01.23;
Скачать: [xml.tar.bz2];
Память: 0.49 MB
Время: 0.044 c