Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2005.11.20;
Скачать: CL | DM;

Вниз

Странный вопрос!   Найти похожие ветки 

 
Dmitrij_K   (2005-11-03 16:10) [0]

привет
есть текст в нижнем регистре
его надо восстановить в норм состояние
начало предложения, имена, фамилии, города и тд чтобы с большой буквы начинались
ну с началом предложений это понятно
а вот реально сделать такое? с фамилиями и тд
ведь нереал хранить список шлишком большой


 
Digitman ©   (2005-11-03 16:13) [1]

структура этих предложений регулярная ?

т.е. любое из этих предложений обязательно содержит в строго определенной последовательности интересующие тебя данные ?


 
Dmitrij_K   (2005-11-03 16:19) [2]

нет/
текст может быть любым


 
evvcom ©   (2005-11-03 16:24) [3]

это тебе словарь нужен


 
Dmitrij_K   (2005-11-03 16:25) [4]

любым те нормальные предложения
мама мыла раму. папа поехал в москву
Мама мыла раму. Папа поехал в Москву


 
Digitman ©   (2005-11-03 16:25) [5]

ну и как ты себе это мыслишь - среди беспорядочной свалки слов определить, что вот это слово - именно фамилия, а вот это - именно название города ?


 
Dmitrij_K   (2005-11-03 16:25) [6]

словарь тогда получится огромный


 
Dmitrij_K   (2005-11-03 16:27) [7]

вот никак себе не могу представить, как это может выглядить

те нереал без словаря?


 
Digitman ©   (2005-11-03 16:27) [8]


> мама мыла раму. папа поехал в москву
> Мама мыла раму. Папа поехал в Москву


если именно в такой форме, то это и есть регулярная структура) ..


 
Amoeba ©   (2005-11-03 16:29) [9]

Если текст произвольный, то задача восстановления более-менее без ошибок - практически нереальная. На порядки быстрее будет делать это вручную в редакторе, чем заполнять немерянного объема списки для программы (ее-то написать не слишком долгое дело). Даже если это реализовать, то в любом случае ручной контроль на выходе будет озязателен.


 
Dmitrij_K   (2005-11-03 16:40) [10]

лана.
спасибо за помощь



Страницы: 1 вся ветка

Текущий архив: 2005.11.20;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.185 c
6-1123135546
DmiSb
2005-08-04 10:05
2005.11.20
Сервер приложений


2-1130842380
stud
2005-11-01 13:53
2005.11.20
запуск нескольких программ в консоли


2-1130616943
Леха
2005-10-30 00:15
2005.11.20
Модуль Consts


2-1130502856
Oxid Burn
2005-10-28 16:34
2005.11.20
Timer


14-1130269405
Операция Тайд или кипечение
2005-10-25 23:43
2005.11.20
Voip