Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2003.04.28;
Скачать: [xml.tar.bz2];

Вниз

поиск строки...   Найти похожие ветки 

 
j.r.   (2003-04-16 08:38) [0]

Есть текстовый файл (около 800 Мб), в нем производится поиск строки (по слову на русском языке), но в файле те строки, в которых это слово присутствует, составлены из лат. символов и кириллицы одновременно (и в uppercase) , т.е. в слове "МОСКВА" на месте буквы м может быть m, в - b и т.д.
Есть ли возможность сделать поиск по виду слова, т.е. вне зависимости от символов, в него входящих (без перебора сочетаний лат. символов и кириллицы)?


 
MBo   (2003-04-16 08:55) [1]

нет ;)


 
Palladin   (2003-04-16 09:52) [2]

я долго смеялся :)))


 
Anatoly Podgoretsky   (2003-04-16 09:57) [3]

Если именно строки, то привести к одному виду и хеш функция, допольнительно использовать индексный файл, для быстрого поиска.


 
Кот Бегемот   (2003-04-16 10:27) [4]

Можно :)
Но тебе нужно определиться с видом.
Если набор символов ограничен то преобразуешь строку которую ищешь и ту которую считываешь к одному виду, где русские и латинские буквы будут иметь одинаковую значимость.
Например:
ABLat: array[диапазон для латинских]of byte = (1,2{это b},3.....
ABRu: array[диапазон для русских]of byte = (1,2{а это в}.....)
т.е. получиться что в этом представлении в=b :)


А потом функцией к одному виду :)


 
Palladin   (2003-04-16 10:53) [5]


> Кот Бегемот © (16.04.03 10:27)

дык косвенный перебор присутствует :)


 
Anatoly Podgoretsky   (2003-04-16 10:56) [6]

Скрипач не нужен


 
j.r.   (2003-04-16 14:40) [7]

хм... поиск в файле производится не считыванием строк - функцией, определяющей позицию искомого слова от начала файла (что намного быстрее перебора), т.е. строка, которую я "считываю", будет известна только тогда,когда узнаю,найдено ли слово и где оно там...


 
Anatoly Podgoretsky   (2003-04-16 15:34) [8]

Ну и что - привести к одному виду и уже потом искать.



Страницы: 1 вся ветка

Форум: "Основная";
Текущий архив: 2003.04.28;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.45 MB
Время: 0.007 c
1-91360
Giemgo
2003-04-13 13:07
2003.04.28
Что делает Halt?


1-91361
Delphinium
2003-04-16 08:42
2003.04.28
Обновление под Delphi 5


1-91394
j.r.
2003-04-16 08:38
2003.04.28
поиск строки...


1-91362
Вопрошающий
2003-04-16 09:32
2003.04.28
FastReport


14-91503
Sir Alex
2003-04-10 12:05
2003.04.28
Миграция пользователей в Active Directory и Домен





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский