Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2004.10.03;
Скачать: CL | DM;

Вниз

Выдирание инфы с web-страниц?   Найти похожие ветки 

 
lipskiy ©   (2004-09-16 21:21) [0]

Есть ли какие-то готовые решения, для того чтобы вычленять опредленную инфу с определенных страниц определенных сайтов? Допустим, я не знаю веб-языков и не могу сам написать такой скрипт, но могу взять готовый и по инструкции "делай раз, делай два" модифицировать под свою конкретную задачу. Допустим также, что я пользуюсь хостингом, где могу разместить этот скрипт.

В результате мне нужно следующее - моя клиентская программа запускается с локального компа, лезет в инет и дергает конкретный линк этого скрипта, который рыщет по заданным страницам и возвращает инфу в установленном формает клиенту, клиент отображает.


 
Palladin ©   (2004-09-16 21:26) [1]

А в каком виде ты себе представляешь готовое решение?


 
lipskiy ©   (2004-09-16 21:30) [2]

в виде скрипта, исходника, но с комментариями для чайников


 
Palladin ©   (2004-09-16 21:35) [3]

Если ты попытаешься формализировать свою хотелку, то ничего кроме дерева тегов не получишь... Это HTML, и он и так уже простой.


 
lipskiy ©   (2004-09-16 21:41) [4]


> Palladin ©   (16.09.04 21:35) [3]

Я не понял, теги почистить и по определнным критериям выдрать текстовую инфу - это что, проблема? Просто я не хочу чтоб на локальный комп грузилась вся страница, а чтоб на стороне сервера скрипт выдрал только необходимое.


 
Palladin ©   (2004-09-16 21:44) [5]

Условия для фильтрования HTML по определенным критериям строятся именно на тэгах. Это первое. Второе. Скрипт то тут причем? Мне казалось ты хочешь html распарсить а не скрипт text/plain написать.


 
DiamondShark ©   (2004-09-16 21:57) [6]

Я делал так: загружается HTML в парсер, приводится к well-formed виду, а потом при помощи XSLT выворачивается как угодно.


 
хм ©   (2004-09-16 22:17) [7]

регэкспы перла для этого удобны


 
lipskiy ©   (2004-09-16 22:20) [8]

Так. я в веб-программировании профан, поэтому наверное изъясняюсь неважно. Попробую снова: я хочу распарсить HTML на стороне сервера и получить в клиент чистые данные. Клиент пишу я, парсер (серверный) я написать не смогу, он мне и нужен в виде нечта готового.

> DiamondShark ©   (16.09.04 21:57) [6]

Где парсер? На локальной машине? Мне это не подходит, такой способ мне и так известен. Распарсить html на дельфях я могу, но дельфовую программу на сервере не запустишь!


 
lipskiy ©   (2004-09-16 22:21) [9]


> регэкспы перла для этого удобны

нисколько не сомневаюсь. но я не знаю на перла, ни пхп, ни яваскрипт. тем не менее я самолично качал готовые скрипты и встраивал их в своих страницы сайта, то есть не зная языка я пользовался скриптами. здесь мне нужно тоже самое.


 
DiamondShark ©   (2004-09-16 22:30) [10]


> lipskiy ©   (16.09.04 22:20) [8]

А хтмл у твоего серверного скриппта откуда берётся?

Какой сервер?

Что тебе доступно на срвере?


 
lipskiy ©   (2004-09-16 23:18) [11]


> А хтмл у твоего серверного скриппта откуда берётся?

Он сам должен загрузить себе указанную заранее страницу.

> Какой сервер?

Не знаю какой, платный хостинг, поддержка явыскрипт и пхп есть.

> Что тебе доступно на срвере?

А фиг знает, я могу только в тарифе своем посмотреть, че там конкретно разрешено. Собст-но, что требуется-то?



Страницы: 1 вся ветка

Текущий архив: 2004.10.03;
Скачать: CL | DM;

Наверх




Память: 0.49 MB
Время: 0.025 c
1-1094818246
TUser
2004-09-10 16:10
2004.10.03
Память и указатели


4-1093321751
Baloo
2004-08-24 08:29
2004.10.03
Координаты каретки в чужом приложении


6-1090467422
v2
2004-07-22 07:37
2004.10.03
Indy TCP CLient не соединяется с прокси-сервером


14-1094843017
Sam007
2004-09-10 23:03
2004.10.03
У кого установленна делфи 6


14-1095317193
080D:07BBh
2004-09-16 10:46
2004.10.03
Intel vs AMD