Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Базы";
Текущий архив: 2008.08.10;
Скачать: [xml.tar.bz2];

Вниз

Нормализация информации   Найти похожие ветки 

 
Petr V. Abramov ©   (2008-02-23 18:50) [80]


> ЮЮ ©   (21.02.08 04:55) [72]
> Если исходить из того, что таблица - это объект предметной
> области, то всякий его эккземляр не должен возникать неизвестно
> откуда

ну подумаешь, следующий вопрос будет по поиску дублей
:)

> Но, как тут заметили имен узбеков, монгол и иже подобных
> здесь нет, потому как они мне не нужны.

автор, а как же осетинские и якутские?


 
Сергей М. ©   (2008-02-23 18:54) [81]

"Матюгальник на березе голосит, как узбеков, латышей сплотила Русь" (С)


 
Альберт   (2008-02-23 19:43) [82]


> автор, а как же осетинские и якутские?

->
> узбеки и иже с ними в контору .. будут  не вхожи)


 
Альберт   (2008-02-23 19:44) [83]


> ты посвятил нас в свою великую тайну

постепенно тайна открывается :)


 
Sergey Masloff   (2008-02-25 12:45) [84]

Ega23 ©   (17.02.08 13:50) [42]
>Кстати, я бы всё равно нормализацию по именам-фамилиям начал бы от >миллиона человек делать.
И был бы не прав. Не ИМХО.
Из реальных я видел имя из 17 слов.Что там имя что отчество хрен его знает и пропусти хоть что-то - смертельная обида.

Но у нас на вводе висит некая эвристика которая делает примитивный лексический анализ и если видит что-то похожее на имя или отчество которые есть у нее в словаре то говорит пользователю - ты не это имел в виду? и если это то заменяет.


 
Альберт   (2008-02-25 13:00) [85]


> Из реальных я видел имя из 17 слов.Что там имя что отчество
> хрен его знает и пропусти хоть что-то - смертельная обида.
>

А по паспорту, как ? Да, еще и регистрация временная она как была ?


 
Sergey Masloff   (2008-02-25 14:02) [86]

Альберт   (25.02.08 13:00) [85]
>А по паспорту, как ?
Вот именно так
>Да, еще и регистрация временная она как была ?
С каких пор дипломатическим работникам требуется временная регистрация?


 
Альберт   (2008-02-25 14:26) [87]


> С каких пор дипломатическим работникам требуется временная
> регистрация?


Подымаю руки, сорри.


 
Sergey Masloff   (2008-02-25 14:31) [88]

Альберт   (25.02.08 14:26) [87]
Да дело не в этом. В российских паспортах тоже могут быть составные имена и фамилии. Выгоды от разделения - никакой.
 В чем смысл отдельного хранения - я из ветки не выяснил. Экономия места? Спорно будет ли она вообще. Что еще?


 
Альберт   (2008-02-25 16:42) [89]

 В чем смысл отдельного хранения - я из ветки не выяснил.
>  Экономия места? Спорно будет ли она вообще. Что еще?


Хорошо, простая задача:
Нужно сформировать письмо и в нем должно быть :

Уважаемый Анатолий Николаевич ! (для русских)
Шановний Анатоліє Миколайовичу ! (для украицев)
и т.д.
Записей в базе клиентов на данный момент больше 25 тысяч.

1.Как быстро выбрать имена и отчества из таблицы ?    
2.Как сделать алфавитку для приемной, где только фамилия и инициалы ?


 
Sergey Masloff   (2008-02-25 21:02) [90]

Альберт   (25.02.08 16:42) [89]

>Хорошо, простая задача:
>Нужно сформировать письмо и в нем должно быть :
Это вообще задача нерешаемая напрямую.

Можно хранить наименование (ФИО) как одно поле и в отдельной таблице языковые синонимы по связке один ко многим.

Я бы сделал так - в таблице поля наименование-поисковое наименование-иностр. наименование (последнее избыточно но удобно для основного иностранного. Например английский эквивалент хранится денормализовано а все остальные - через синонимы потому что английский используется постоянно а остальные - раз в сто лет.

В поисковое наименование при вводе автоматически преобразуется строка из основного наименования например Петров Игорь Иванович => Петров И.И. но пользователь может поправить если автомат неверно отработал. В иностранное можно транслитерировать по умолчанию но тоже с возможностью правки.

Имена и отчества выбирать - зачем? В какой реальной задаче это нужно? Словари имен и отчеств доступны, можно в принципе использовать для проверки но не обязательно. Это уже бантики которые дяют 5% удобства.


 
Павел Калугин ©   (2008-02-25 21:55) [91]

> [89] Альберт   (25.02.08 16:42)

Так может ввсе таки озвучить задачу и предметную область?


 
Ega23 ©   (2008-02-25 21:57) [92]


> Имена взяты с книги "Что имя твое значит", где представлены
> все славянские, греческие и германские их производные.


Марлен там тоже есть?


 
Petr V. Abramov ©   (2008-02-25 22:12) [93]


> и в отдельной таблице языковые синонимы по связке один ко
> многим.

а зачем синонимы? человек все ж либо русский, либо украинец, и обращаться к нему надо либо  "Уважаемый", либо "Шановний". Случай зависимости от политической ситуации выходит за пределы обсуждения :)


> 2.Как сделать алфавитку для приемной, где только фамилия
> и инициалы ?

построить view, в котором будут только фамилия и инициалы, и роли "примная" дать гранты на него.


 
Германн ©   (2008-02-26 01:54) [94]

Терзают меня смутные сомнения, что Альберт задумал что-то супер-пуперное. Сам не зная куда он лезет.


 
Sergey13 ©   (2008-02-26 08:54) [95]

> [94] Германн ©   (26.02.08 01:54)

А по моему он пытается придумать задачу под свою (не очень удачную, ИМХО, но интересную с его т.з.) идею.


 
Павел Калугин ©   (2008-02-26 11:32) [96]


> Альберт   (23.02.08 18:28) [78]
> Если нет данных по паспорту, тогда сверка из пенсионной
> базы.

Иванов Петр Петрович 21 год студент (пенсионного еще нет)
через полгода с новым паспортом взамен утеряного
Иванов Петр Петрович 21 год студент (пенсионного еще нет)

два разных ? или один и тот же?

Переводить имена это бред.

Завести структуру для хранения обращения и не мучать кошек

полное ФИО        Иванов Иван Иванович
краткое ФИО       Иванов И. И.
обрашатся как    Дорогому Ванюшеньке


 
Petr V. Abramov ©   (2008-02-26 13:35) [97]


> Павел Калугин ©   (26.02.08 11:32) [96]

я б обращение все-таки флагом/справочником сделал. Чтоб "Дарагой" не написал кто-нить


 
Альберт   (2008-02-26 14:34) [98]


> Терзают меня смутные сомнения, что Альберт задумал что-то
> супер-пуперное. Сам не зная куда он лезет.

Потом будет видно, но зато сейчас ончень интересно, да и опыта наберусь.

> А по моему он пытается придумать задачу под свою (не очень
> удачную, ИМХО, но интересную с его т.з.) идею.

Идея автоматизации отчетов и документов, плюс самый новый справочник по телефонам и адресам клиентов и организаций.

Но вопросы все таки есть.
а)Нужно поле "Фамилия имя отчество" ежемесячно для новых "клиентов" передавать в ексель как три ячейки:
1.Фамилия
2.Имя
3.Отчество

б)Поиск (выборка) по частям:
пример найти "Вагиф Оглы", но оператор ввела "Вгиф Аглы"


 
Sergey13 ©   (2008-02-26 14:49) [99]

> [98] Альберт   (26.02.08 14:34)
> Идея автоматизации отчетов и документов

Это настолько общее определение, что практически ЛЮБАЯ программа под это определение попадает.

> плюс самый новый справочник по телефонам и адресам клиентов и организаций.
Эта задача не особо нуждается в лингвистических примочках.

Хотя если интересно, то почему бы не помучаться. Но с другой стороны, раз работаешь над конкретной задачей рискуешь нарваться на вопрос работодателя: "А че ты тут делаешь то?"


 
Альберт   (2008-02-26 14:57) [100]


> "А че ты тут делаешь то?"

А я инженер-аналитик . Так вот запросы могут быть разные у начальства, а я себе работу облегчаю. А информация дорого стоит.


 
Sergey13 ©   (2008-02-26 15:04) [101]

> [100] Альберт   (26.02.08 14:57)
> А информация дорого стоит.

Так то информация, а не ее склонения по падежам.


 
Sergey13 ©   (2008-02-26 15:11) [102]

> [10] Альберт   (15.02.08 15:12)
> можна очень много сделать полезного для приемной и т.д

> [100] Альберт   (26.02.08 14:57)
> А я инженер-аналитик ....  я себе работу облегчаю.

Хватит отираться в приемной и пудрить мозги секретарше! 8-)))))))))))))


 
Альберт   (2008-02-26 15:33) [103]


> Хватит отираться в приемной и пудрить мозги секретарше!
> 8-)))))))))))))

Споймал, согласен. :)


 
Ditrix ©   (2008-02-26 16:06) [104]

>>а)Нужно поле "Фамилия имя отчество" ежемесячно для новых "клиентов"
>>передавать в ексель как три ячейки:
вот в процессе формирования реестра новеньких и разделишь фио на составляющие.

а усложнять "ежедневку" - недальновидно.
Kepp It Simple Stupid
// озвучивалось тут уже


 
Павел Калугин ©   (2008-02-27 07:21) [105]

> [97] Petr V. Abramov ©   (26.02.08 13:35)

А я бы оставил на усмотрение Манагера. если он считает обосновано чт дАрАгой Леонид правильное обращение именно к этому леониду то пусть буде так. а если слажал  пусть меньше бабла получит

> [98] Альберт   (26.02.08 14:34)
> Идея автоматизации отчетов и документов

Идея далеко не нова.


> [98] Альберт   (26.02.08 14:34)
> а)Нужно поле "Фамилия имя отчество" ежемесячно для новых
> "клиентов" передавать в ексель как три ячейки:

И вопрос в чем? и хранить три поля. Но полное и краткое ФИО хранить не давая их править. То есть править можно одно из трех полей а полное и краткое фио тем же триггером корректировать но ни как не через форму


> б)Поиск (выборка) по частям:

а вот это лечится 2-мя путями. и тольо комплексом
1. баблом по вбившему ошибку или дубль
2. смотреть на функции , например, soundex. Для меня открытием стали когда-то слова "Функция Левенштайна". рекомендую поискать и почитать.
Но опять же лечит только комплексный подход. И больший вес таки играет административная его часть. И если администрация в таких вопросах не идет на компромис то.. может им не слишком оно надо?


> [104] Ditrix ©   (26.02.08 16:06)
> вот в процессе формирования реестра новеньких и разделишь
> фио на составляющие.

угу. особенно если имя 5 слов а фамилия 2 слова. Не, таки придется хранить кажное в своем поле. Но справочник имен.. Эт чтоб секретарше на жениха гадать, разве что.


 
Альберт   (2008-02-27 10:00) [106]


> может им не слишком оно надо?

Надо, иначе получит начальник,  а дальше по цепочке, в том числе и я.


 
Sergey13 ©   (2008-02-27 10:27) [107]

> [106] Альберт   (27.02.08 10:00)
> Надо

Это слово достойно приватных бесед в курилке. Документально фиксируются обычно документы типа "Техническое задание". Кстати приступать к активной генерации идей рекомендуется только после хотя бы беглого ознакомления с указанным документом, а лучше после его согласования.


 
Павел Калугин ©   (2008-02-27 14:32) [108]


> Альберт   (27.02.08 10:00) [106]

так от сначала ты читаешь про всякие там Soundex и прочие подобные алгоритмы
потом думаешь насколько оно того, срастается.
потом идешь к шефу и гришь:
дубликаты я уберу, проверку такую и такую прикручу. Но это не панацея. Поэтому я еще прикрутил лог кто что ввел. И по шапке за косяки ввода нада давать им за то что искать не умеют. Пока по шапке получаем тока мы это не дело.
И в отчето кроме Ф.И.О. новопоступивших писать ФИО(логин) сотрудника вмолотившего с датой ввода (правки)


> Sergey13 ©   (27.02.08 10:27) [107]

Хотябы документ вида "Хотелка" получить и подписать :) а то явно секретаршу вздрючили, она поплакалась и срочно изобретать лисапед


 
Sergey13 ©   (2008-02-27 14:38) [109]

> [108] Павел Калугин ©   (27.02.08 14:32)
> Хотябы документ вида "Хотелка" получить и подписать

Так я и говорю типа "Техническое задание". 8-)


 
Альберт   (2008-02-27 16:26) [110]

Благодарю всех отвечавших !!



Страницы: 1 2 3 вся ветка

Форум: "Базы";
Текущий архив: 2008.08.10;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.67 MB
Время: 0.011 c
9-1173279235
Morpheuz
2007-03-07 17:53
2008.08.10
Vision document


15-1214376304
Галинка
2008-06-25 10:45
2008.08.10
"Венгерская нотация" для c#


15-1213947164
destructor
2008-06-20 11:32
2008.08.10
ICQ system. Почему здесь еще молчат?


9-1172844946
Пётр_К
2007-03-02 17:15
2008.08.10
Центр окружности по 3-м точкам на дуге.


15-1214516044
homm
2008-06-27 01:34
2008.08.10
Поздравляю всех с победой





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский