Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2004.10.03;
Скачать: CL | DM;

Вниз

Выдирание инфы с web-страниц?   Найти похожие ветки 

 
lipskiy ©   (2004-09-16 21:21) [0]

Есть ли какие-то готовые решения, для того чтобы вычленять опредленную инфу с определенных страниц определенных сайтов? Допустим, я не знаю веб-языков и не могу сам написать такой скрипт, но могу взять готовый и по инструкции "делай раз, делай два" модифицировать под свою конкретную задачу. Допустим также, что я пользуюсь хостингом, где могу разместить этот скрипт.

В результате мне нужно следующее - моя клиентская программа запускается с локального компа, лезет в инет и дергает конкретный линк этого скрипта, который рыщет по заданным страницам и возвращает инфу в установленном формает клиенту, клиент отображает.


 
Palladin ©   (2004-09-16 21:26) [1]

А в каком виде ты себе представляешь готовое решение?


 
lipskiy ©   (2004-09-16 21:30) [2]

в виде скрипта, исходника, но с комментариями для чайников


 
Palladin ©   (2004-09-16 21:35) [3]

Если ты попытаешься формализировать свою хотелку, то ничего кроме дерева тегов не получишь... Это HTML, и он и так уже простой.


 
lipskiy ©   (2004-09-16 21:41) [4]


> Palladin ©   (16.09.04 21:35) [3]

Я не понял, теги почистить и по определнным критериям выдрать текстовую инфу - это что, проблема? Просто я не хочу чтоб на локальный комп грузилась вся страница, а чтоб на стороне сервера скрипт выдрал только необходимое.


 
Palladin ©   (2004-09-16 21:44) [5]

Условия для фильтрования HTML по определенным критериям строятся именно на тэгах. Это первое. Второе. Скрипт то тут причем? Мне казалось ты хочешь html распарсить а не скрипт text/plain написать.


 
DiamondShark ©   (2004-09-16 21:57) [6]

Я делал так: загружается HTML в парсер, приводится к well-formed виду, а потом при помощи XSLT выворачивается как угодно.


 
хм ©   (2004-09-16 22:17) [7]

регэкспы перла для этого удобны


 
lipskiy ©   (2004-09-16 22:20) [8]

Так. я в веб-программировании профан, поэтому наверное изъясняюсь неважно. Попробую снова: я хочу распарсить HTML на стороне сервера и получить в клиент чистые данные. Клиент пишу я, парсер (серверный) я написать не смогу, он мне и нужен в виде нечта готового.

> DiamondShark ©   (16.09.04 21:57) [6]

Где парсер? На локальной машине? Мне это не подходит, такой способ мне и так известен. Распарсить html на дельфях я могу, но дельфовую программу на сервере не запустишь!


 
lipskiy ©   (2004-09-16 22:21) [9]


> регэкспы перла для этого удобны

нисколько не сомневаюсь. но я не знаю на перла, ни пхп, ни яваскрипт. тем не менее я самолично качал готовые скрипты и встраивал их в своих страницы сайта, то есть не зная языка я пользовался скриптами. здесь мне нужно тоже самое.


 
DiamondShark ©   (2004-09-16 22:30) [10]


> lipskiy ©   (16.09.04 22:20) [8]

А хтмл у твоего серверного скриппта откуда берётся?

Какой сервер?

Что тебе доступно на срвере?


 
lipskiy ©   (2004-09-16 23:18) [11]


> А хтмл у твоего серверного скриппта откуда берётся?

Он сам должен загрузить себе указанную заранее страницу.

> Какой сервер?

Не знаю какой, платный хостинг, поддержка явыскрипт и пхп есть.

> Что тебе доступно на срвере?

А фиг знает, я могу только в тарифе своем посмотреть, че там конкретно разрешено. Собст-но, что требуется-то?



Страницы: 1 вся ветка

Текущий архив: 2004.10.03;
Скачать: CL | DM;

Наверх




Память: 0.49 MB
Время: 0.032 c
1-1095171547
Vladimir_
2004-09-14 18:19
2004.10.03
Помогите с TreeView


3-1094113603
denisww
2004-09-02 12:26
2004.10.03
Нужна помосчь


14-1094389442
начинающий
2004-09-05 17:04
2004.10.03
Delphi vs. C++


8-1089126295
Popovich A.
2004-07-06 19:04
2004.10.03
Трансформация BMP в JPG


14-1094799124
Vlad Oshin
2004-09-10 10:52
2004.10.03
Собаки, как кормить слепого щенка