Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2006.12.17;
Скачать: CL | DM;

Вниз

Поиск текста в файлах.   Найти похожие ветки 

 
PHPDeveloper   (2006-11-02 06:47) [0]

Здравствуйте.
Имеетя группа HTML файлов, около 1000 файлов, нужно сделать поиск  текста по файлам.
Как лучше всего организовать поиск текста по файлам? Может весь текст в БД добавить и там делать поиск? Или есть какие другие идеи?


 
Loginov Dmitry ©   (2006-11-02 07:50) [1]

Windows+F поможет


 
SpellCaster   (2006-11-02 11:01) [2]

Думаю, имелся в виду поиск из своей программы )).
Самый примитивный способ - загружать каждый файл в поток и юзать Pos. Более продуктивных способов не знаю, попробуй поискать компонент на torry.net


 
Jeer ©   (2006-11-02 11:55) [3]

Если разовый - прямой поиск.
Если регулярный - какой-либо из вариантов поисковой машины, самописной или нет - второй вопрос.


 
PHPDeveloper   (2006-11-02 15:38) [4]

Форум по DELPHI, значит, если ХОРОШО подумать, будет ясно, что поиск надо сделать программно.
Что-нибудь дельное бы посоветовали


 
novill ©   (2006-11-02 16:22) [5]

Если ХОРОШО подумать, то будет ясно, что для получения конструктивного ответа нужен грамотно сформулированный вопрос!

0. Чем тебе не подходит загрузка файлов в поток и поиск в нем?
1. Тебе искать в "сыром" хтмл?
2. Регулярные выражения или просто подстроки?


 
PHPDeveloper   (2006-11-02 17:25) [6]

Итак:
1. Ну допустим мне искать не в "сыром"  ХТМЛе, что от этого изменится?
2. Мне все подходит, просто интересны какие еще есть идеи.
3. Искать строки


 
Jeer ©   (2006-11-02 17:35) [7]

PHPDeveloper   (02.11.06 17:25) [6]

Еще раз - [3]

И ?


 
novill ©   (2006-11-02 18:50) [8]

> Мне все подходит, просто интересны какие еще есть идеи.

ну, например,
можно в программе вызвать поиск explorera, потом его результаты считывать
можно открывать файл не потоком, а через переменную типа file или textfile
можно открывать файлы через twebbrowser и разбираться чтов и итоге отображено пользователю, а можно самому теги расковырять
можно и в базу данных загнать и пусть сама ищет
можно вызывать консольные grep или find и пусть они ищут
Идей вообще много...


> [7] Jeer ©   (02.11.06 17:35)

да он вроде признался что просто вхождения ищет.


 
Jeer ©   (2006-11-02 18:54) [9]

их можно искать разово или регулярно.
соответственно и подходы могут быть разные.


 
Psychedelic ©   (2006-11-02 20:54) [10]

НЕ вижу сложностей. Загружайте частями в буфер (анпирмер в массив) и ищите с pos . Самый простой способ, но не самый быстрый...


 
Palladin ©   (2006-11-03 17:16) [11]


>  Самый простой способ

Не только самый простой, а самый общий, и в большинстве случаев наибыстрейший.


 
Jeer ©   (2006-11-03 17:24) [12]

+ для разового поиска.


 
Palladin ©   (2006-11-03 17:58) [13]

) хем, а БМ индексы каждый раз перестраивать при изменении содержимого быстрее будет для неразового? )


 
TStas ©   (2006-11-04 17:46) [14]

парсерочек простенький написать, ну не тупое же вхождение искать. ХТМЛ вообще-то регистронезависимый



Страницы: 1 вся ветка

Текущий архив: 2006.12.17;
Скачать: CL | DM;

Наверх




Память: 0.49 MB
Время: 0.055 c
15-1164404890
J_box
2006-11-25 00:48
2006.12.17
Никто не попадал в подобную ситуацию?


15-1164323826
Номер
2006-11-24 02:17
2006.12.17
Что случилось с pisem.net ? Уже дней пять не работает


15-1164388278
Dmitry_177
2006-11-24 20:11
2006.12.17
MessageBox на другом компе через cmd


15-1164542824
Dbe
2006-11-26 15:07
2006.12.17
Задача коммивояжера! Мое решение, помогите дорешать!


2-1164862974
Чувачела
2006-11-30 08:02
2006.12.17
Вопрос по DBGrid