Форум: "Основная";
Текущий архив: 2003.04.28;
Скачать: [xml.tar.bz2];
Внизпоиск строки... Найти похожие ветки
← →
j.r. (2003-04-16 08:38) [0]Есть текстовый файл (около 800 Мб), в нем производится поиск строки (по слову на русском языке), но в файле те строки, в которых это слово присутствует, составлены из лат. символов и кириллицы одновременно (и в uppercase) , т.е. в слове "МОСКВА" на месте буквы м может быть m, в - b и т.д.
Есть ли возможность сделать поиск по виду слова, т.е. вне зависимости от символов, в него входящих (без перебора сочетаний лат. символов и кириллицы)?
← →
MBo (2003-04-16 08:55) [1]нет ;)
← →
Palladin (2003-04-16 09:52) [2]я долго смеялся :)))
← →
Anatoly Podgoretsky (2003-04-16 09:57) [3]Если именно строки, то привести к одному виду и хеш функция, допольнительно использовать индексный файл, для быстрого поиска.
← →
Кот Бегемот (2003-04-16 10:27) [4]Можно :)
Но тебе нужно определиться с видом.
Если набор символов ограничен то преобразуешь строку которую ищешь и ту которую считываешь к одному виду, где русские и латинские буквы будут иметь одинаковую значимость.
Например:
ABLat: array[диапазон для латинских]of byte = (1,2{это b},3.....
ABRu: array[диапазон для русских]of byte = (1,2{а это в}.....)
т.е. получиться что в этом представлении в=b :)
А потом функцией к одному виду :)
← →
Palladin (2003-04-16 10:53) [5]
> Кот Бегемот © (16.04.03 10:27)
дык косвенный перебор присутствует :)
← →
Anatoly Podgoretsky (2003-04-16 10:56) [6]Скрипач не нужен
← →
j.r. (2003-04-16 14:40) [7]хм... поиск в файле производится не считыванием строк - функцией, определяющей позицию искомого слова от начала файла (что намного быстрее перебора), т.е. строка, которую я "считываю", будет известна только тогда,когда узнаю,найдено ли слово и где оно там...
← →
Anatoly Podgoretsky (2003-04-16 15:34) [8]Ну и что - привести к одному виду и уже потом искать.
Страницы: 1 вся ветка
Форум: "Основная";
Текущий архив: 2003.04.28;
Скачать: [xml.tar.bz2];
Память: 0.45 MB
Время: 0.007 c