Форум: "Основная";
Текущий архив: 2006.12.17;
Скачать: [xml.tar.bz2];
ВнизПоиск текста в файлах. Найти похожие ветки
← →
PHPDeveloper (2006-11-02 06:47) [0]Здравствуйте.
Имеетя группа HTML файлов, около 1000 файлов, нужно сделать поиск текста по файлам.
Как лучше всего организовать поиск текста по файлам? Может весь текст в БД добавить и там делать поиск? Или есть какие другие идеи?
← →
Loginov Dmitry © (2006-11-02 07:50) [1]Windows+F поможет
← →
SpellCaster (2006-11-02 11:01) [2]Думаю, имелся в виду поиск из своей программы )).
Самый примитивный способ - загружать каждый файл в поток и юзать Pos. Более продуктивных способов не знаю, попробуй поискать компонент на torry.net
← →
Jeer © (2006-11-02 11:55) [3]Если разовый - прямой поиск.
Если регулярный - какой-либо из вариантов поисковой машины, самописной или нет - второй вопрос.
← →
PHPDeveloper (2006-11-02 15:38) [4]Форум по DELPHI, значит, если ХОРОШО подумать, будет ясно, что поиск надо сделать программно.
Что-нибудь дельное бы посоветовали
← →
novill © (2006-11-02 16:22) [5]Если ХОРОШО подумать, то будет ясно, что для получения конструктивного ответа нужен грамотно сформулированный вопрос!
0. Чем тебе не подходит загрузка файлов в поток и поиск в нем?
1. Тебе искать в "сыром" хтмл?
2. Регулярные выражения или просто подстроки?
← →
PHPDeveloper (2006-11-02 17:25) [6]Итак:
1. Ну допустим мне искать не в "сыром" ХТМЛе, что от этого изменится?
2. Мне все подходит, просто интересны какие еще есть идеи.
3. Искать строки
← →
Jeer © (2006-11-02 17:35) [7]PHPDeveloper (02.11.06 17:25) [6]
Еще раз - [3]
И ?
← →
novill © (2006-11-02 18:50) [8]> Мне все подходит, просто интересны какие еще есть идеи.
ну, например,
можно в программе вызвать поиск explorera, потом его результаты считывать
можно открывать файл не потоком, а через переменную типа file или textfile
можно открывать файлы через twebbrowser и разбираться чтов и итоге отображено пользователю, а можно самому теги расковырять
можно и в базу данных загнать и пусть сама ищет
можно вызывать консольные grep или find и пусть они ищут
Идей вообще много...
> [7] Jeer © (02.11.06 17:35)
да он вроде признался что просто вхождения ищет.
← →
Jeer © (2006-11-02 18:54) [9]их можно искать разово или регулярно.
соответственно и подходы могут быть разные.
← →
Psychedelic © (2006-11-02 20:54) [10]НЕ вижу сложностей. Загружайте частями в буфер (анпирмер в массив) и ищите с pos . Самый простой способ, но не самый быстрый...
← →
Palladin © (2006-11-03 17:16) [11]
> Самый простой способ
Не только самый простой, а самый общий, и в большинстве случаев наибыстрейший.
← →
Jeer © (2006-11-03 17:24) [12]+ для разового поиска.
← →
Palladin © (2006-11-03 17:58) [13]) хем, а БМ индексы каждый раз перестраивать при изменении содержимого быстрее будет для неразового? )
← →
TStas © (2006-11-04 17:46) [14]парсерочек простенький написать, ну не тупое же вхождение искать. ХТМЛ вообще-то регистронезависимый
Страницы: 1 вся ветка
Форум: "Основная";
Текущий архив: 2006.12.17;
Скачать: [xml.tar.bz2];
Память: 0.47 MB
Время: 0.044 c