Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2003.04.28;
Скачать: CL | DM;

Вниз

поиск строки...   Найти похожие ветки 

 
j.r.   (2003-04-16 08:38) [0]

Есть текстовый файл (около 800 Мб), в нем производится поиск строки (по слову на русском языке), но в файле те строки, в которых это слово присутствует, составлены из лат. символов и кириллицы одновременно (и в uppercase) , т.е. в слове "МОСКВА" на месте буквы м может быть m, в - b и т.д.
Есть ли возможность сделать поиск по виду слова, т.е. вне зависимости от символов, в него входящих (без перебора сочетаний лат. символов и кириллицы)?


 
MBo ©   (2003-04-16 08:55) [1]

нет ;)


 
Palladin ©   (2003-04-16 09:52) [2]

я долго смеялся :)))


 
Anatoly Podgoretsky ©   (2003-04-16 09:57) [3]

Если именно строки, то привести к одному виду и хеш функция, допольнительно использовать индексный файл, для быстрого поиска.


 
Кот Бегемот ©   (2003-04-16 10:27) [4]

Можно :)
Но тебе нужно определиться с видом.
Если набор символов ограничен то преобразуешь строку которую ищешь и ту которую считываешь к одному виду, где русские и латинские буквы будут иметь одинаковую значимость.
Например:
ABLat: array[диапазон для латинских]of byte = (1,2{это b},3.....
ABRu: array[диапазон для русских]of byte = (1,2{а это в}.....)
т.е. получиться что в этом представлении в=b :)


А потом функцией к одному виду :)


 
Palladin ©   (2003-04-16 10:53) [5]


> Кот Бегемот © (16.04.03 10:27)

дык косвенный перебор присутствует :)


 
Anatoly Podgoretsky ©   (2003-04-16 10:56) [6]

Скрипач не нужен


 
j.r.   (2003-04-16 14:40) [7]

хм... поиск в файле производится не считыванием строк - функцией, определяющей позицию искомого слова от начала файла (что намного быстрее перебора), т.е. строка, которую я "считываю", будет известна только тогда,когда узнаю,найдено ли слово и где оно там...


 
Anatoly Podgoretsky ©   (2003-04-16 15:34) [8]

Ну и что - привести к одному виду и уже потом искать.



Страницы: 1 вся ветка

Текущий архив: 2003.04.28;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.019 c
14-91474
Stager
2003-04-09 13:46
2003.04.28
Встречался ли Вам такой грид?


4-91598
Loda
2003-03-03 10:44
2003.04.28
Определить момент изменения Caption окна


3-91168
TempAlly
2003-04-09 14:18
2003.04.28
Date-константа в TQuery.Filter


3-91154
alex _bredin
2003-04-09 10:35
2003.04.28
Индексы и SQL


14-91481
Supreme 2
2003-04-09 17:50
2003.04.28
Хорошо ли быть фанатом?