Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2003.04.28;
Скачать: CL | DM;

Вниз

поиск строки...   Найти похожие ветки 

 
j.r.   (2003-04-16 08:38) [0]

Есть текстовый файл (около 800 Мб), в нем производится поиск строки (по слову на русском языке), но в файле те строки, в которых это слово присутствует, составлены из лат. символов и кириллицы одновременно (и в uppercase) , т.е. в слове "МОСКВА" на месте буквы м может быть m, в - b и т.д.
Есть ли возможность сделать поиск по виду слова, т.е. вне зависимости от символов, в него входящих (без перебора сочетаний лат. символов и кириллицы)?


 
MBo ©   (2003-04-16 08:55) [1]

нет ;)


 
Palladin ©   (2003-04-16 09:52) [2]

я долго смеялся :)))


 
Anatoly Podgoretsky ©   (2003-04-16 09:57) [3]

Если именно строки, то привести к одному виду и хеш функция, допольнительно использовать индексный файл, для быстрого поиска.


 
Кот Бегемот ©   (2003-04-16 10:27) [4]

Можно :)
Но тебе нужно определиться с видом.
Если набор символов ограничен то преобразуешь строку которую ищешь и ту которую считываешь к одному виду, где русские и латинские буквы будут иметь одинаковую значимость.
Например:
ABLat: array[диапазон для латинских]of byte = (1,2{это b},3.....
ABRu: array[диапазон для русских]of byte = (1,2{а это в}.....)
т.е. получиться что в этом представлении в=b :)


А потом функцией к одному виду :)


 
Palladin ©   (2003-04-16 10:53) [5]


> Кот Бегемот © (16.04.03 10:27)

дык косвенный перебор присутствует :)


 
Anatoly Podgoretsky ©   (2003-04-16 10:56) [6]

Скрипач не нужен


 
j.r.   (2003-04-16 14:40) [7]

хм... поиск в файле производится не считыванием строк - функцией, определяющей позицию искомого слова от начала файла (что намного быстрее перебора), т.е. строка, которую я "считываю", будет известна только тогда,когда узнаю,найдено ли слово и где оно там...


 
Anatoly Podgoretsky ©   (2003-04-16 15:34) [8]

Ну и что - привести к одному виду и уже потом искать.



Страницы: 1 вся ветка

Текущий архив: 2003.04.28;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.02 c
1-91303
bpv
2003-04-17 15:03
2003.04.28
Создание класса


1-91378
sashas
2003-04-16 12:29
2003.04.28
Помоготе разобраться в иерархии.


14-91454
panov
2003-04-10 19:27
2003.04.28
ВАУ! А я работу в Питере нашел!


14-91498
Lokk
2003-04-10 15:52
2003.04.28
Народ , у кого нить есть реализация метода прогонки ?????


3-91218
litr_spirta
2003-04-10 13:53
2003.04.28
Нужен эффективный алгоритм