Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Потрепаться";
Текущий архив: 2004.10.03;
Скачать: [xml.tar.bz2];

Вниз

Выдирание инфы с web-страниц?   Найти похожие ветки 

 
lipskiy ©   (2004-09-16 21:21) [0]

Есть ли какие-то готовые решения, для того чтобы вычленять опредленную инфу с определенных страниц определенных сайтов? Допустим, я не знаю веб-языков и не могу сам написать такой скрипт, но могу взять готовый и по инструкции "делай раз, делай два" модифицировать под свою конкретную задачу. Допустим также, что я пользуюсь хостингом, где могу разместить этот скрипт.

В результате мне нужно следующее - моя клиентская программа запускается с локального компа, лезет в инет и дергает конкретный линк этого скрипта, который рыщет по заданным страницам и возвращает инфу в установленном формает клиенту, клиент отображает.


 
Palladin ©   (2004-09-16 21:26) [1]

А в каком виде ты себе представляешь готовое решение?


 
lipskiy ©   (2004-09-16 21:30) [2]

в виде скрипта, исходника, но с комментариями для чайников


 
Palladin ©   (2004-09-16 21:35) [3]

Если ты попытаешься формализировать свою хотелку, то ничего кроме дерева тегов не получишь... Это HTML, и он и так уже простой.


 
lipskiy ©   (2004-09-16 21:41) [4]


> Palladin ©   (16.09.04 21:35) [3]

Я не понял, теги почистить и по определнным критериям выдрать текстовую инфу - это что, проблема? Просто я не хочу чтоб на локальный комп грузилась вся страница, а чтоб на стороне сервера скрипт выдрал только необходимое.


 
Palladin ©   (2004-09-16 21:44) [5]

Условия для фильтрования HTML по определенным критериям строятся именно на тэгах. Это первое. Второе. Скрипт то тут причем? Мне казалось ты хочешь html распарсить а не скрипт text/plain написать.


 
DiamondShark ©   (2004-09-16 21:57) [6]

Я делал так: загружается HTML в парсер, приводится к well-formed виду, а потом при помощи XSLT выворачивается как угодно.


 
хм ©   (2004-09-16 22:17) [7]

регэкспы перла для этого удобны


 
lipskiy ©   (2004-09-16 22:20) [8]

Так. я в веб-программировании профан, поэтому наверное изъясняюсь неважно. Попробую снова: я хочу распарсить HTML на стороне сервера и получить в клиент чистые данные. Клиент пишу я, парсер (серверный) я написать не смогу, он мне и нужен в виде нечта готового.

> DiamondShark ©   (16.09.04 21:57) [6]

Где парсер? На локальной машине? Мне это не подходит, такой способ мне и так известен. Распарсить html на дельфях я могу, но дельфовую программу на сервере не запустишь!


 
lipskiy ©   (2004-09-16 22:21) [9]


> регэкспы перла для этого удобны

нисколько не сомневаюсь. но я не знаю на перла, ни пхп, ни яваскрипт. тем не менее я самолично качал готовые скрипты и встраивал их в своих страницы сайта, то есть не зная языка я пользовался скриптами. здесь мне нужно тоже самое.


 
DiamondShark ©   (2004-09-16 22:30) [10]


> lipskiy ©   (16.09.04 22:20) [8]

А хтмл у твоего серверного скриппта откуда берётся?

Какой сервер?

Что тебе доступно на срвере?


 
lipskiy ©   (2004-09-16 23:18) [11]


> А хтмл у твоего серверного скриппта откуда берётся?

Он сам должен загрузить себе указанную заранее страницу.

> Какой сервер?

Не знаю какой, платный хостинг, поддержка явыскрипт и пхп есть.

> Что тебе доступно на срвере?

А фиг знает, я могу только в тарифе своем посмотреть, че там конкретно разрешено. Собст-но, что требуется-то?



Страницы: 1 вся ветка

Форум: "Потрепаться";
Текущий архив: 2004.10.03;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.47 MB
Время: 0.049 c
14-1094838234
Vit@ly
2004-09-10 21:43
2004.10.03
Женевская конвенция


14-1095162390
Knight
2004-09-14 15:46
2004.10.03
Можно ли использовать помощников MS в своих программах?


14-1094389442
начинающий
2004-09-05 17:04
2004.10.03
Delphi vs. C++


1-1095262239
Slaviq
2004-09-15 19:30
2004.10.03
Печать через темопринтер BZ-2


11-1080885301
nick_cr
2004-04-02 09:55
2004.10.03
Delphi





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский