Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2006.12.17;
Скачать: CL | DM;

Вниз

Поиск текста в файлах.   Найти похожие ветки 

 
PHPDeveloper   (2006-11-02 06:47) [0]

Здравствуйте.
Имеетя группа HTML файлов, около 1000 файлов, нужно сделать поиск  текста по файлам.
Как лучше всего организовать поиск текста по файлам? Может весь текст в БД добавить и там делать поиск? Или есть какие другие идеи?


 
Loginov Dmitry ©   (2006-11-02 07:50) [1]

Windows+F поможет


 
SpellCaster   (2006-11-02 11:01) [2]

Думаю, имелся в виду поиск из своей программы )).
Самый примитивный способ - загружать каждый файл в поток и юзать Pos. Более продуктивных способов не знаю, попробуй поискать компонент на torry.net


 
Jeer ©   (2006-11-02 11:55) [3]

Если разовый - прямой поиск.
Если регулярный - какой-либо из вариантов поисковой машины, самописной или нет - второй вопрос.


 
PHPDeveloper   (2006-11-02 15:38) [4]

Форум по DELPHI, значит, если ХОРОШО подумать, будет ясно, что поиск надо сделать программно.
Что-нибудь дельное бы посоветовали


 
novill ©   (2006-11-02 16:22) [5]

Если ХОРОШО подумать, то будет ясно, что для получения конструктивного ответа нужен грамотно сформулированный вопрос!

0. Чем тебе не подходит загрузка файлов в поток и поиск в нем?
1. Тебе искать в "сыром" хтмл?
2. Регулярные выражения или просто подстроки?


 
PHPDeveloper   (2006-11-02 17:25) [6]

Итак:
1. Ну допустим мне искать не в "сыром"  ХТМЛе, что от этого изменится?
2. Мне все подходит, просто интересны какие еще есть идеи.
3. Искать строки


 
Jeer ©   (2006-11-02 17:35) [7]

PHPDeveloper   (02.11.06 17:25) [6]

Еще раз - [3]

И ?


 
novill ©   (2006-11-02 18:50) [8]

> Мне все подходит, просто интересны какие еще есть идеи.

ну, например,
можно в программе вызвать поиск explorera, потом его результаты считывать
можно открывать файл не потоком, а через переменную типа file или textfile
можно открывать файлы через twebbrowser и разбираться чтов и итоге отображено пользователю, а можно самому теги расковырять
можно и в базу данных загнать и пусть сама ищет
можно вызывать консольные grep или find и пусть они ищут
Идей вообще много...


> [7] Jeer ©   (02.11.06 17:35)

да он вроде признался что просто вхождения ищет.


 
Jeer ©   (2006-11-02 18:54) [9]

их можно искать разово или регулярно.
соответственно и подходы могут быть разные.


 
Psychedelic ©   (2006-11-02 20:54) [10]

НЕ вижу сложностей. Загружайте частями в буфер (анпирмер в массив) и ищите с pos . Самый простой способ, но не самый быстрый...


 
Palladin ©   (2006-11-03 17:16) [11]


>  Самый простой способ

Не только самый простой, а самый общий, и в большинстве случаев наибыстрейший.


 
Jeer ©   (2006-11-03 17:24) [12]

+ для разового поиска.


 
Palladin ©   (2006-11-03 17:58) [13]

) хем, а БМ индексы каждый раз перестраивать при изменении содержимого быстрее будет для неразового? )


 
TStas ©   (2006-11-04 17:46) [14]

парсерочек простенький написать, ну не тупое же вхождение искать. ХТМЛ вообще-то регистронезависимый



Страницы: 1 вся ветка

Текущий архив: 2006.12.17;
Скачать: CL | DM;

Наверх




Память: 0.49 MB
Время: 0.038 c
2-1164896709
KyRo
2006-11-30 17:25
2006.12.17
DBGRID с разноцветніми строками


9-1140506358
Древолаз
2006-02-21 10:19
2006.12.17
GLScene не найден Variants.dcu


4-1154629515
ancara
2006-08-03 22:25
2006.12.17
определить момент подключения USB-накопителя


10-1126702382
Dmitrich
2005-09-14 16:53
2006.12.17
Откр. файлов Word и Excel. Раннее, позднее связывание или OLE


4-1155297332
Godness
2006-08-11 15:55
2006.12.17
Как определить, какое чужое дочернее окно в фокусе ввода?