Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2010.11.21;
Скачать: CL | DM;

Вниз

"Вытаскивание" нужной информации из HTML-страницы.   Найти похожие ветки 

 
PeSmaker ©   (2010-08-26 17:20) [0]

Подскажите, пожалуйста, как вытащить нужную информацию из Интернета. Лучше бы не через idHTTP. Заранее благодарен.


 
Медвежонок Пятачок ©   (2010-08-26 17:27) [1]

а при чем здесь вообще идшттп, если вопрос про вынимание инфы из страницы?
вопрос подразумевает что страница уже есть и дело только за выниманием.
в противном случае вопрос задан неверно.


 
PeSmaker ©   (2010-08-26 17:32) [2]

Медвежонок Пятачок, мне нужно взять информацию из страницы в интернете,а не из страницы, которая находится на компе. Хотя, страницу можно программно сохранить на комп, а потом вынимать оттуда инфу =)
Мне в принципе все-равно, пожалуйста, подскажите, что делать в случае, когда дело только за выниманием =)


 
Dennis I. Komarov ©   (2010-08-26 17:41) [3]


> взять информацию из страницы в интернете,а не из страницы,
>  которая находится на компе.

А в чем принципиальная разница?

> подскажите, что делать в случае, когда дело только за выниманием

Взять страницу, найти в ней нужную инфу, вынуть

З.Ы.
 Страницы разные бывают, и инфа тоже...


 
Медвежонок Пятачок ©   (2010-08-26 17:42) [4]

мне нужно взять информацию из страницы в интернете,а не из страницы, которая находится на компе

значит у тебя нет страницы.
и вопрос о вынимании инфы из нее вообще не стоит.


 
PeSmaker ©   (2010-08-26 17:43) [5]

Медвежонок Пятачок, если для тебя не стоит, то подскажи как это делать...пожалуйста....


 
PeSmaker ©   (2010-08-26 17:45) [6]

Dennis I. Komarov, что ты имеешь ввиду... как программно ее найти и вынуть


 
Dennis I. Komarov ©   (2010-08-26 17:46) [7]


> PeSmaker ©   (26.08.10 17:45) [6]

Читай ЗЫ


 
PeSmaker ©   (2010-08-26 17:48) [8]

Dennis I. Komarov, давай я скину страницу, и что из нее нужно вынуть!!!


 
PeSmaker ©   (2010-08-26 17:50) [9]

страница: http://ua.oriflame.com/recruits/
нужно вынуть:
внизу номер и действие каталога, в нашем случае:
КАТАЛОГ 11
8/8/2010 - 28/8/2010

ЗЫ:
и желательно картинку каталога =)


 
Медвежонок Пятачок ©   (2010-08-26 17:53) [10]

Медвежонок Пятачок, если для тебя не стоит, то подскажи как это делать...пожалуйста....

Вынуть что-то можно только из того, что уже находится в оперативной памяти твоего компа.


 
PeSmaker ©   (2010-08-26 17:54) [11]

Медвежонок Пятачок, тут ты не прав...


 
Медвежонок Пятачок ©   (2010-08-26 18:01) [12]

Я прав.
Читаем исходный вопрос:

Вытаскивание" нужной информации из HTML-страницы

Так вот, "вынуть инфу из с страницы" если она не в памяти твоего  компа нельзя.


 
PeSmaker ©   (2010-08-26 18:04) [13]

Мне лучше помогите как вынуть инфу,а не умничать.......


 
Anatoly Podgoretsky ©   (2010-08-26 19:01) [14]

> PeSmaker  (26.08.2010 17:20:00)  [0]

:Если начинать с такого уровня, то придется писать маленькую книгу.


 
app ©   (2010-08-26 19:05) [15]

> PeSmaker  (26.08.2010 18:04:13)  [13]

Повежливее.


 
Плохиш ©   (2010-08-26 21:44) [16]


> PeSmaker ©   (26.08.10 17:20)  

TWebBrowser


 
0x00FF00 ©   (2010-08-26 23:04) [17]

здесь можно обойтись вообще без Delphi:
$ wget -qO- http://ua.oriflame.com/recruits/ | grep -A1 Каталог | sed s/.*\<img\ src=\"\\\(.*\\\).jpg.*/http:\\/\\/ua.oriflame.com\\1.jpg/\;s/.*\<span\ id.*\>\\\(.*\\\)\<\\/span\>.*/\\1/

http://ua.oriflame.com/catalog-images/brochure/uk_UA/201011/93E2C8951ECF4A8222DA2EF3C1AE91F60715D9C4/1_s.jpg

--
Каталог 11
8/8/2010 - 28/8/2010


ArchLinux 2.6.35


 
stas ©   (2010-08-27 11:45) [18]

PeSmaker ©   (26.08.10 18:04) [13]
1. Как закачать страницу в переменную string разобрался?
2. Смотри RegExpr (регулярные выражения) скачать можно бесплатно.


 
Sapersky   (2010-08-27 14:08) [19]

Лучше бы не через idHTTP

Можно через Synapse, httpsend.pas -> HttpGetText.
Поиск нужной строки - можно регулярками, можно просто StrPos. Какую именно строку искать - открой страницу текстовым редактором и ищи некое уникальное выражение рядом с "Каталог 11", которого нет в другом месте страницы. Для надёжности можно несколько строк искать... регулярки, как я понимаю, как раз для этого и предназначены. Картинка - выдёргиваешь ссылку рядом с "Каталог 11" и закачиваешь HttpGetBinary.



Страницы: 1 вся ветка

Текущий архив: 2010.11.21;
Скачать: CL | DM;

Наверх




Память: 0.51 MB
Время: 0.01 c
15-1281731393
Юрий
2010-08-14 00:29
2010.11.21
С днем рождения ! 14 августа 2010 суббота


2-1282880802
Гость
2010-08-27 07:46
2010.11.21
Существует ли аналог Википедии по функциям Дельфи?


3-1247743513
Tonich
2009-07-16 15:25
2010.11.21
SQL запрос


15-1281990589
Юрий
2010-08-17 00:29
2010.11.21
С днем рождения ! 16 августа 2010 понедельник


15-1281385795
Юрий
2010-08-10 00:29
2010.11.21
С днем рождения ! 10 августа 2010 вторник