Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Начинающим";
Текущий архив: 2010.11.21;
Скачать: [xml.tar.bz2];

Вниз

"Вытаскивание" нужной информации из HTML-страницы.   Найти похожие ветки 

 
PeSmaker ©   (2010-08-26 17:20) [0]

Подскажите, пожалуйста, как вытащить нужную информацию из Интернета. Лучше бы не через idHTTP. Заранее благодарен.


 
Медвежонок Пятачок ©   (2010-08-26 17:27) [1]

а при чем здесь вообще идшттп, если вопрос про вынимание инфы из страницы?
вопрос подразумевает что страница уже есть и дело только за выниманием.
в противном случае вопрос задан неверно.


 
PeSmaker ©   (2010-08-26 17:32) [2]

Медвежонок Пятачок, мне нужно взять информацию из страницы в интернете,а не из страницы, которая находится на компе. Хотя, страницу можно программно сохранить на комп, а потом вынимать оттуда инфу =)
Мне в принципе все-равно, пожалуйста, подскажите, что делать в случае, когда дело только за выниманием =)


 
Dennis I. Komarov ©   (2010-08-26 17:41) [3]


> взять информацию из страницы в интернете,а не из страницы,
>  которая находится на компе.

А в чем принципиальная разница?

> подскажите, что делать в случае, когда дело только за выниманием

Взять страницу, найти в ней нужную инфу, вынуть

З.Ы.
 Страницы разные бывают, и инфа тоже...


 
Медвежонок Пятачок ©   (2010-08-26 17:42) [4]

мне нужно взять информацию из страницы в интернете,а не из страницы, которая находится на компе

значит у тебя нет страницы.
и вопрос о вынимании инфы из нее вообще не стоит.


 
PeSmaker ©   (2010-08-26 17:43) [5]

Медвежонок Пятачок, если для тебя не стоит, то подскажи как это делать...пожалуйста....


 
PeSmaker ©   (2010-08-26 17:45) [6]

Dennis I. Komarov, что ты имеешь ввиду... как программно ее найти и вынуть


 
Dennis I. Komarov ©   (2010-08-26 17:46) [7]


> PeSmaker ©   (26.08.10 17:45) [6]

Читай ЗЫ


 
PeSmaker ©   (2010-08-26 17:48) [8]

Dennis I. Komarov, давай я скину страницу, и что из нее нужно вынуть!!!


 
PeSmaker ©   (2010-08-26 17:50) [9]

страница: http://ua.oriflame.com/recruits/
нужно вынуть:
внизу номер и действие каталога, в нашем случае:
КАТАЛОГ 11
8/8/2010 - 28/8/2010

ЗЫ:
и желательно картинку каталога =)


 
Медвежонок Пятачок ©   (2010-08-26 17:53) [10]

Медвежонок Пятачок, если для тебя не стоит, то подскажи как это делать...пожалуйста....

Вынуть что-то можно только из того, что уже находится в оперативной памяти твоего компа.


 
PeSmaker ©   (2010-08-26 17:54) [11]

Медвежонок Пятачок, тут ты не прав...


 
Медвежонок Пятачок ©   (2010-08-26 18:01) [12]

Я прав.
Читаем исходный вопрос:

Вытаскивание" нужной информации из HTML-страницы

Так вот, "вынуть инфу из с страницы" если она не в памяти твоего  компа нельзя.


 
PeSmaker ©   (2010-08-26 18:04) [13]

Мне лучше помогите как вынуть инфу,а не умничать.......


 
Anatoly Podgoretsky ©   (2010-08-26 19:01) [14]

> PeSmaker  (26.08.2010 17:20:00)  [0]

:Если начинать с такого уровня, то придется писать маленькую книгу.


 
app ©   (2010-08-26 19:05) [15]

> PeSmaker  (26.08.2010 18:04:13)  [13]

Повежливее.


 
Плохиш ©   (2010-08-26 21:44) [16]


> PeSmaker ©   (26.08.10 17:20)  

TWebBrowser


 
0x00FF00 ©   (2010-08-26 23:04) [17]

здесь можно обойтись вообще без Delphi:
$ wget -qO- http://ua.oriflame.com/recruits/ | grep -A1 Каталог | sed s/.*\<img\ src=\"\\\(.*\\\).jpg.*/http:\\/\\/ua.oriflame.com\\1.jpg/\;s/.*\<span\ id.*\>\\\(.*\\\)\<\\/span\>.*/\\1/

http://ua.oriflame.com/catalog-images/brochure/uk_UA/201011/93E2C8951ECF4A8222DA2EF3C1AE91F60715D9C4/1_s.jpg

--
Каталог 11
8/8/2010 - 28/8/2010


ArchLinux 2.6.35


 
stas ©   (2010-08-27 11:45) [18]

PeSmaker ©   (26.08.10 18:04) [13]
1. Как закачать страницу в переменную string разобрался?
2. Смотри RegExpr (регулярные выражения) скачать можно бесплатно.


 
Sapersky   (2010-08-27 14:08) [19]

Лучше бы не через idHTTP

Можно через Synapse, httpsend.pas -> HttpGetText.
Поиск нужной строки - можно регулярками, можно просто StrPos. Какую именно строку искать - открой страницу текстовым редактором и ищи некое уникальное выражение рядом с "Каталог 11", которого нет в другом месте страницы. Для надёжности можно несколько строк искать... регулярки, как я понимаю, как раз для этого и предназначены. Картинка - выдёргиваешь ссылку рядом с "Каталог 11" и закачиваешь HttpGetBinary.



Страницы: 1 вся ветка

Форум: "Начинающим";
Текущий архив: 2010.11.21;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.49 MB
Время: 0.004 c
15-1280295714
И. Павел
2010-07-28 09:41
2010.11.21
Ученые "перепрограммировали" клетку


15-1281510965
AlexDn
2010-08-11 11:16
2010.11.21
Движок Вконтакте


11-1224882649
Neep
2008-10-25 01:10
2010.11.21
KOL 2.88 и шрифт, объясните как?


15-1281587871
IGray
2010-08-12 08:37
2010.11.21
Ищу исходники функции IntToStr на паскале


15-1281203081
track
2010-08-07 21:44
2010.11.21
старый софт





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский