"Вытаскивание" нужной информации из HTML-страницы.

← →
PeSmaker © (2010-08-26 17:20) [0]

Подскажите, пожалуйста, как вытащить нужную информацию из Интернета. Лучше бы не через idHTTP. Заранее благодарен.

← →
Медвежонок Пятачок © (2010-08-26 17:27) [1]

а при чем здесь вообще идшттп, если вопрос про вынимание инфы из страницы?
вопрос подразумевает что страница уже есть и дело только за выниманием.
в противном случае вопрос задан неверно.

← →
PeSmaker © (2010-08-26 17:32) [2]

Медвежонок Пятачок, мне нужно взять информацию из страницы в интернете,а не из страницы, которая находится на компе. Хотя, страницу можно программно сохранить на комп, а потом вынимать оттуда инфу =)
Мне в принципе все-равно, пожалуйста, подскажите, что делать в случае, когда дело только за выниманием =)

← →
Dennis I. Komarov © (2010-08-26 17:41) [3]

> взять информацию из страницы в интернете,а не из страницы,
> которая находится на компе.

А в чем принципиальная разница?

> подскажите, что делать в случае, когда дело только за выниманием

Взять страницу, найти в ней нужную инфу, вынуть

З.Ы.
Страницы разные бывают, и инфа тоже...

← →
Медвежонок Пятачок © (2010-08-26 17:42) [4]

мне нужно взять информацию из страницы в интернете,а не из страницы, которая находится на компе

значит у тебя нет страницы.
и вопрос о вынимании инфы из нее вообще не стоит.

← →
PeSmaker © (2010-08-26 17:43) [5]

Медвежонок Пятачок, если для тебя не стоит, то подскажи как это делать...пожалуйста....

← →
PeSmaker © (2010-08-26 17:45) [6]

Dennis I. Komarov, что ты имеешь ввиду... как программно ее найти и вынуть

← →
Dennis I. Komarov © (2010-08-26 17:46) [7]

> PeSmaker © (26.08.10 17:45) [6]

Читай ЗЫ

← →
PeSmaker © (2010-08-26 17:48) [8]

Dennis I. Komarov, давай я скину страницу, и что из нее нужно вынуть!!!

← →
PeSmaker © (2010-08-26 17:50) [9]

страница: http://ua.oriflame.com/recruits/
нужно вынуть:
внизу номер и действие каталога, в нашем случае:
КАТАЛОГ 11
8/8/2010 - 28/8/2010

ЗЫ:
и желательно картинку каталога =)

← →
Медвежонок Пятачок © (2010-08-26 17:53) [10]

Медвежонок Пятачок, если для тебя не стоит, то подскажи как это делать...пожалуйста....

Вынуть что-то можно только из того, что уже находится в оперативной памяти твоего компа.

← →
PeSmaker © (2010-08-26 17:54) [11]

Медвежонок Пятачок, тут ты не прав...

← →
Медвежонок Пятачок © (2010-08-26 18:01) [12]

Я прав.
Читаем исходный вопрос:

Вытаскивание" нужной информации из HTML-страницы

Так вот, "вынуть инфу из с страницы" если она не в памяти твоего компа нельзя.

← →
PeSmaker © (2010-08-26 18:04) [13]

Мне лучше помогите как вынуть инфу,а не умничать.......

> PeSmaker (26.08.2010 17:20:00) [0]

:Если начинать с такого уровня, то придется писать маленькую книгу.

> PeSmaker (26.08.2010 18:04:13) [13]

Повежливее.

здесь можно обойтись вообще без Delphi:
$ wget -qO- http://ua.oriflame.com/recruits/ | grep -A1 Каталог | sed s/.*\<img\ src=\"\\$.*\\$.jpg.*/http:\\/\\/ua.oriflame.com\\1.jpg/\;s/.*\<span\ id.*\>\\$.*\\$\<\\/span\>.*/\\1/ http://ua.oriflame.com/catalog-images/brochure/uk_UA/201011/93E2C8951ECF4A8222DA2EF3C1AE91F60715D9C4/1_s.jpg -- Каталог 11 8/8/2010 - 28/8/2010

ArchLinux 2.6.35

PeSmaker © (26.08.10 18:04) [13]
1. Как закачать страницу в переменную string разобрался?
2. Смотри RegExpr (регулярные выражения) скачать можно бесплатно.

← →
Sapersky (2010-08-27 14:08) [19]

Лучше бы не через idHTTP

Можно через Synapse, httpsend.pas -> HttpGetText.
Поиск нужной строки - можно регулярками, можно просто StrPos. Какую именно строку искать - открой страницу текстовым редактором и ищи некое уникальное выражение рядом с "Каталог 11", которого нет в другом месте страницы. Для надёжности можно несколько строк искать... регулярки, как я понимаю, как раз для этого и предназначены. Картинка - выдёргиваешь ссылку рядом с "Каталог 11" и закачиваешь HttpGetBinary.

"Вытаскивание" нужной информации из HTML-страницы. Найти похожие ветки