Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Начинающим";
Текущий архив: 2008.03.02;
Скачать: [xml.tar.bz2];

Вниз

Парсер   Найти похожие ветки 

 
Алексей Шестченко   (2008-02-07 20:13) [0]

Если я неправильно понял,то поправьте и подскажите.
Не совсем "оценивающее ситуацию" начальство дало задание "проверить интеренет" на наличие сайтов где находятся название нашей программы.
Понятное дело что вручное это не возможно и я так понял что надо сделать некий парсер. Может кто дать ссылки или направить в какую сторону копать и что делать. Маленький опыт с delphi есть.
Заранее благодарю.


 
Джо ©   (2008-02-07 20:17) [1]

Google.com
и поиск по резултатам.


 
clickmaker ©   (2008-02-07 20:19) [2]


> "проверить интеренет" на наличие сайтов где находятся название
> нашей программы

google.ru и yandex.ru


 
Алексей Шестченко   (2008-02-07 20:31) [3]

Большое спасибо за ответы.
Я не в полной мере описал задачу. Нужно получить только ссылки на эти сайты,а затем в отчет. Т.е. в memo построчно записывать найденные ссылки.
С уважением, Алексей.


 
Алексей Шестченко   (2008-02-08 04:41) [4]

Скажите пожалуйста есть ли аналоги, работающие быстрее чем
HTTP.Get(); ??
полученную ссылку загружаю в мемо и далее анализирую.
если использваоть не мемо а работать с памятью то будет быстрее? подскажите каким образом увеличить скорость работы ?
Спасибо


 
ketmar ©   (2008-02-08 05:08) [5]

всё то же самое. из html от гугля можно тупо выдёргивать ссылки регулярными выражениями.

---
Understanding is not required. Only obedience.


 
ketmar ©   (2008-02-08 05:10) [6]

>[4] Алексей Шестченко (2008-02-08 04:41:00)
куда уж быстрей-то? разве телепатией.

а в memo не надо. что за привычка — как хранилище, так memo. это редактор для заметок, а не хранилище для мусора.

скорость работы же увеличить просто: переписать программу. откуда нам знать, что ты там натворил у себя в коде? но 17-ю строку проверь, на всякий случай.

---
Understanding is not required. Only obedience.


 
Бегущий человек ©   (2008-02-08 05:26) [7]

>ketmar ©   (08.02.08 05:10) [6]
Ничего удобнее memo для отображения разного текстового мусора в VCL еще не придумано.
> аффтар
Пока нет кода - подсказывать нечего.


 
Алексей Шестченко   (2008-02-08 05:39) [8]

показывал же код:
memo1.Lines.Text := HTTP.Get();
но текста много и вставляется не сразу, потом обратока из этого же memo, может стоит использовать StringList?
Спасибо за ответы


 
ketmar ©   (2008-02-08 06:06) [9]

>[7] Бегущий человек © (2008-02-08 05:26:00)
ну вот и посмотри на [8]. если memo для этого придумано — я Гигер.

---
Understanding is not required. Only obedience.


 
ketmar ©   (2008-02-08 06:07) [10]

>[8] Алексей Шестченко (2008-02-08 05:39:00)
стоит. не просто стоит, а категорически рекомендуется. а ещё лучше — получить, например, всё скопом и натравить на это многокилометровый regexp. и язык лучше взять perl, например.

---
Understanding is not required. Only obedience.


 
Anatoly Podgoretsky ©   (2008-02-08 08:40) [11]


> memo1.Lines.Text := HTTP.Get();

Это не парсер и единственная потеря здесь - время на выделение памяти, кстати очень много, примерно раза в три/четыре больше чем размер текста.
Хочешь ускорить и уменьшить потери, то S  := HTTP.Get();


 
han_malign ©   (2008-02-08 11:19) [12]


> Ничего удобнее memo для отображения разного текстового мусора в VCL еще не придумано.

- для всякого текстового мусора существуют логи...

> но текста много и вставляется не сразу, потом обратока из
> этого же memo, может стоит использовать StringList?

- а чем не устраивет простой String и конкатенация?(см. Anatoly Podgoretsky © [11])


 
DrPass ©   (2008-02-08 12:36) [13]


> Алексей Шестченко   (08.02.08 05:39) [8]
> показывал же код:
> memo1.Lines.Text := HTTP.Get();
> но текста много и вставляется не сразу

Ну наверное ж вставляется не сразу не потому, что текста много, а потому, что сначала ищет страницу в Интернете и скачивает ее к тебе на компьютер. И только потом загружает в мемо


 
Алексей Шестченко   (2008-02-08 13:27) [14]

разницы нету что в стринг что в мемо, ~50-200 мс


 
Алексей Шестченко   (2008-02-08 13:28) [15]

так вот может надо использовать другой компонент нежели idhttp?
Благодарю всех за ответы и трату времени!


 
ketmar ©   (2008-02-08 13:33) [16]

>[15] Алексей Шестченко (2008-02-08 13:28:00)
>может надо использовать другой компонент нежели idhttp?
а что ты такого делаешь, что так жестоко на тормоза наступаешь? может, виноват и не жираф?

---
Understanding is not required. Only obedience.


 
Palladin ©   (2008-02-08 13:38) [17]


> [14] Алексей Шестченко   (08.02.08 13:27)

дык а с чего ты взял что это время парсинга? как бы от доступности хоста это разве не зависит?


 
Palladin ©   (2008-02-08 13:40) [18]

это ж какой интернет надо иметь что бы за меньше чем 50 мс ресурс получался...


 
Алексей Шестченко   (2008-02-08 15:14) [19]

Да...что то совсем я:)
Вообщем всё нормально работает! Спасибо всем, тему можно закрывать!



Страницы: 1 вся ветка

Форум: "Начинающим";
Текущий архив: 2008.03.02;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.49 MB
Время: 0.059 c
15-1201593227
GEN++
2008-01-29 10:53
2008.03.02
"Разыменование указателя"


3-1192156062
MIG
2007-10-12 06:27
2008.03.02
Редактируемые запросы


2-1202118889
VAD*Anti Gopn!k
2008-02-04 12:54
2008.03.02
a := a + 1 или Inc(a)


3-1192440323
DelphiN!
2007-10-15 13:25
2008.03.02
SQL запрос. Выборка из динамического столбца


2-1202208254
031178
2008-02-05 13:44
2008.03.02
Код клавиши





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский