Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2003.04.28;
Скачать: CL | DM;

Вниз

поиск строки...   Найти похожие ветки 

 
j.r.   (2003-04-16 08:38) [0]

Есть текстовый файл (около 800 Мб), в нем производится поиск строки (по слову на русском языке), но в файле те строки, в которых это слово присутствует, составлены из лат. символов и кириллицы одновременно (и в uppercase) , т.е. в слове "МОСКВА" на месте буквы м может быть m, в - b и т.д.
Есть ли возможность сделать поиск по виду слова, т.е. вне зависимости от символов, в него входящих (без перебора сочетаний лат. символов и кириллицы)?


 
MBo ©   (2003-04-16 08:55) [1]

нет ;)


 
Palladin ©   (2003-04-16 09:52) [2]

я долго смеялся :)))


 
Anatoly Podgoretsky ©   (2003-04-16 09:57) [3]

Если именно строки, то привести к одному виду и хеш функция, допольнительно использовать индексный файл, для быстрого поиска.


 
Кот Бегемот ©   (2003-04-16 10:27) [4]

Можно :)
Но тебе нужно определиться с видом.
Если набор символов ограничен то преобразуешь строку которую ищешь и ту которую считываешь к одному виду, где русские и латинские буквы будут иметь одинаковую значимость.
Например:
ABLat: array[диапазон для латинских]of byte = (1,2{это b},3.....
ABRu: array[диапазон для русских]of byte = (1,2{а это в}.....)
т.е. получиться что в этом представлении в=b :)


А потом функцией к одному виду :)


 
Palladin ©   (2003-04-16 10:53) [5]


> Кот Бегемот © (16.04.03 10:27)

дык косвенный перебор присутствует :)


 
Anatoly Podgoretsky ©   (2003-04-16 10:56) [6]

Скрипач не нужен


 
j.r.   (2003-04-16 14:40) [7]

хм... поиск в файле производится не считыванием строк - функцией, определяющей позицию искомого слова от начала файла (что намного быстрее перебора), т.е. строка, которую я "считываю", будет известна только тогда,когда узнаю,найдено ли слово и где оно там...


 
Anatoly Podgoretsky ©   (2003-04-16 15:34) [8]

Ну и что - привести к одному виду и уже потом искать.



Страницы: 1 вся ветка

Текущий архив: 2003.04.28;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.017 c
14-91468
Карлсон
2003-04-09 19:12
2003.04.28
сколько всего сервиспаков для win2k?


3-91201
GRR
2003-04-10 10:12
2003.04.28
Помогите разобраться с транзакциями в IB


3-91189
pavel_rosl
2003-04-10 01:10
2003.04.28
удалить несколько записей


3-91168
TempAlly
2003-04-09 14:18
2003.04.28
Date-константа в TQuery.Filter


3-91140
Zelius
2003-04-08 18:17
2003.04.28
Тормозит SQL запрос при выборке из двух алиасов!