Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Начинающим";
Текущий архив: 2010.11.21;
Скачать: [xml.tar.bz2];

Вниз

"Вытаскивание" нужной информации из HTML-страницы.   Найти похожие ветки 

 
PeSmaker ©   (2010-08-26 17:20) [0]

Подскажите, пожалуйста, как вытащить нужную информацию из Интернета. Лучше бы не через idHTTP. Заранее благодарен.


 
Медвежонок Пятачок ©   (2010-08-26 17:27) [1]

а при чем здесь вообще идшттп, если вопрос про вынимание инфы из страницы?
вопрос подразумевает что страница уже есть и дело только за выниманием.
в противном случае вопрос задан неверно.


 
PeSmaker ©   (2010-08-26 17:32) [2]

Медвежонок Пятачок, мне нужно взять информацию из страницы в интернете,а не из страницы, которая находится на компе. Хотя, страницу можно программно сохранить на комп, а потом вынимать оттуда инфу =)
Мне в принципе все-равно, пожалуйста, подскажите, что делать в случае, когда дело только за выниманием =)


 
Dennis I. Komarov ©   (2010-08-26 17:41) [3]


> взять информацию из страницы в интернете,а не из страницы,
>  которая находится на компе.

А в чем принципиальная разница?

> подскажите, что делать в случае, когда дело только за выниманием

Взять страницу, найти в ней нужную инфу, вынуть

З.Ы.
 Страницы разные бывают, и инфа тоже...


 
Медвежонок Пятачок ©   (2010-08-26 17:42) [4]

мне нужно взять информацию из страницы в интернете,а не из страницы, которая находится на компе

значит у тебя нет страницы.
и вопрос о вынимании инфы из нее вообще не стоит.


 
PeSmaker ©   (2010-08-26 17:43) [5]

Медвежонок Пятачок, если для тебя не стоит, то подскажи как это делать...пожалуйста....


 
PeSmaker ©   (2010-08-26 17:45) [6]

Dennis I. Komarov, что ты имеешь ввиду... как программно ее найти и вынуть


 
Dennis I. Komarov ©   (2010-08-26 17:46) [7]


> PeSmaker ©   (26.08.10 17:45) [6]

Читай ЗЫ


 
PeSmaker ©   (2010-08-26 17:48) [8]

Dennis I. Komarov, давай я скину страницу, и что из нее нужно вынуть!!!


 
PeSmaker ©   (2010-08-26 17:50) [9]

страница: http://ua.oriflame.com/recruits/
нужно вынуть:
внизу номер и действие каталога, в нашем случае:
КАТАЛОГ 11
8/8/2010 - 28/8/2010

ЗЫ:
и желательно картинку каталога =)


 
Медвежонок Пятачок ©   (2010-08-26 17:53) [10]

Медвежонок Пятачок, если для тебя не стоит, то подскажи как это делать...пожалуйста....

Вынуть что-то можно только из того, что уже находится в оперативной памяти твоего компа.


 
PeSmaker ©   (2010-08-26 17:54) [11]

Медвежонок Пятачок, тут ты не прав...


 
Медвежонок Пятачок ©   (2010-08-26 18:01) [12]

Я прав.
Читаем исходный вопрос:

Вытаскивание" нужной информации из HTML-страницы

Так вот, "вынуть инфу из с страницы" если она не в памяти твоего  компа нельзя.


 
PeSmaker ©   (2010-08-26 18:04) [13]

Мне лучше помогите как вынуть инфу,а не умничать.......


 
Anatoly Podgoretsky ©   (2010-08-26 19:01) [14]

> PeSmaker  (26.08.2010 17:20:00)  [0]

:Если начинать с такого уровня, то придется писать маленькую книгу.


 
app ©   (2010-08-26 19:05) [15]

> PeSmaker  (26.08.2010 18:04:13)  [13]

Повежливее.


 
Плохиш ©   (2010-08-26 21:44) [16]


> PeSmaker ©   (26.08.10 17:20)  

TWebBrowser


 
0x00FF00 ©   (2010-08-26 23:04) [17]

здесь можно обойтись вообще без Delphi:
$ wget -qO- http://ua.oriflame.com/recruits/ | grep -A1 Каталог | sed s/.*\<img\ src=\"\\\(.*\\\).jpg.*/http:\\/\\/ua.oriflame.com\\1.jpg/\;s/.*\<span\ id.*\>\\\(.*\\\)\<\\/span\>.*/\\1/

http://ua.oriflame.com/catalog-images/brochure/uk_UA/201011/93E2C8951ECF4A8222DA2EF3C1AE91F60715D9C4/1_s.jpg

--
Каталог 11
8/8/2010 - 28/8/2010


ArchLinux 2.6.35


 
stas ©   (2010-08-27 11:45) [18]

PeSmaker ©   (26.08.10 18:04) [13]
1. Как закачать страницу в переменную string разобрался?
2. Смотри RegExpr (регулярные выражения) скачать можно бесплатно.


 
Sapersky   (2010-08-27 14:08) [19]

Лучше бы не через idHTTP

Можно через Synapse, httpsend.pas -> HttpGetText.
Поиск нужной строки - можно регулярками, можно просто StrPos. Какую именно строку искать - открой страницу текстовым редактором и ищи некое уникальное выражение рядом с "Каталог 11", которого нет в другом месте страницы. Для надёжности можно несколько строк искать... регулярки, как я понимаю, как раз для этого и предназначены. Картинка - выдёргиваешь ссылку рядом с "Каталог 11" и закачиваешь HttpGetBinary.



Страницы: 1 вся ветка

Форум: "Начинающим";
Текущий архив: 2010.11.21;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.49 MB
Время: 0.004 c
15-1281378423
crab
2010-08-09 22:27
2010.11.21
Требуется c++ -> delphi конвертор


2-1282718003
12
2010-08-25 10:33
2010.11.21
Как выбрать TTreeNode? Аналогично, если по нему кликнули мышкой


15-1281455569
Дмитрий С
2010-08-10 19:52
2010.11.21
Как скрыть испольуемые фреймом компоненты?


15-1280664123
TComponent
2010-08-01 16:02
2010.11.21
Отправка email c командной строки


15-1281731393
Юрий
2010-08-14 00:29
2010.11.21
С днем рождения ! 14 августа 2010 суббота





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский