Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2006.12.17;
Скачать: [xml.tar.bz2];

Вниз

Поиск текста в файлах.   Найти похожие ветки 

 
PHPDeveloper   (2006-11-02 06:47) [0]

Здравствуйте.
Имеетя группа HTML файлов, около 1000 файлов, нужно сделать поиск  текста по файлам.
Как лучше всего организовать поиск текста по файлам? Может весь текст в БД добавить и там делать поиск? Или есть какие другие идеи?


 
Loginov Dmitry ©   (2006-11-02 07:50) [1]

Windows+F поможет


 
SpellCaster   (2006-11-02 11:01) [2]

Думаю, имелся в виду поиск из своей программы )).
Самый примитивный способ - загружать каждый файл в поток и юзать Pos. Более продуктивных способов не знаю, попробуй поискать компонент на torry.net


 
Jeer ©   (2006-11-02 11:55) [3]

Если разовый - прямой поиск.
Если регулярный - какой-либо из вариантов поисковой машины, самописной или нет - второй вопрос.


 
PHPDeveloper   (2006-11-02 15:38) [4]

Форум по DELPHI, значит, если ХОРОШО подумать, будет ясно, что поиск надо сделать программно.
Что-нибудь дельное бы посоветовали


 
novill ©   (2006-11-02 16:22) [5]

Если ХОРОШО подумать, то будет ясно, что для получения конструктивного ответа нужен грамотно сформулированный вопрос!

0. Чем тебе не подходит загрузка файлов в поток и поиск в нем?
1. Тебе искать в "сыром" хтмл?
2. Регулярные выражения или просто подстроки?


 
PHPDeveloper   (2006-11-02 17:25) [6]

Итак:
1. Ну допустим мне искать не в "сыром"  ХТМЛе, что от этого изменится?
2. Мне все подходит, просто интересны какие еще есть идеи.
3. Искать строки


 
Jeer ©   (2006-11-02 17:35) [7]

PHPDeveloper   (02.11.06 17:25) [6]

Еще раз - [3]

И ?


 
novill ©   (2006-11-02 18:50) [8]

> Мне все подходит, просто интересны какие еще есть идеи.

ну, например,
можно в программе вызвать поиск explorera, потом его результаты считывать
можно открывать файл не потоком, а через переменную типа file или textfile
можно открывать файлы через twebbrowser и разбираться чтов и итоге отображено пользователю, а можно самому теги расковырять
можно и в базу данных загнать и пусть сама ищет
можно вызывать консольные grep или find и пусть они ищут
Идей вообще много...


> [7] Jeer ©   (02.11.06 17:35)

да он вроде признался что просто вхождения ищет.


 
Jeer ©   (2006-11-02 18:54) [9]

их можно искать разово или регулярно.
соответственно и подходы могут быть разные.


 
Psychedelic ©   (2006-11-02 20:54) [10]

НЕ вижу сложностей. Загружайте частями в буфер (анпирмер в массив) и ищите с pos . Самый простой способ, но не самый быстрый...


 
Palladin ©   (2006-11-03 17:16) [11]


>  Самый простой способ

Не только самый простой, а самый общий, и в большинстве случаев наибыстрейший.


 
Jeer ©   (2006-11-03 17:24) [12]

+ для разового поиска.


 
Palladin ©   (2006-11-03 17:58) [13]

) хем, а БМ индексы каждый раз перестраивать при изменении содержимого быстрее будет для неразового? )


 
TStas ©   (2006-11-04 17:46) [14]

парсерочек простенький написать, ну не тупое же вхождение искать. ХТМЛ вообще-то регистронезависимый



Страницы: 1 вся ветка

Форум: "Основная";
Текущий архив: 2006.12.17;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.48 MB
Время: 0.046 c
2-1165063812
Max.66RUS
2006-12-02 15:50
2006.12.17
Пара вопросов...


3-1160601200
Vadim31
2006-10-12 01:13
2006.12.17
ADOQuery.Event


15-1164542000
Чапаев
2006-11-26 14:53
2006.12.17
Пакеты


15-1164740254
IMHO
2006-11-28 21:57
2006.12.17
28 ноября: В Москве образовались многочисленные пробки


2-1164738833
Стрельников
2006-11-28 21:33
2006.12.17
ComboBox





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский