Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Потрепаться";
Текущий архив: 2004.10.03;
Скачать: [xml.tar.bz2];

Вниз

Выдирание инфы с web-страниц?   Найти похожие ветки 

 
lipskiy ©   (2004-09-16 21:21) [0]

Есть ли какие-то готовые решения, для того чтобы вычленять опредленную инфу с определенных страниц определенных сайтов? Допустим, я не знаю веб-языков и не могу сам написать такой скрипт, но могу взять готовый и по инструкции "делай раз, делай два" модифицировать под свою конкретную задачу. Допустим также, что я пользуюсь хостингом, где могу разместить этот скрипт.

В результате мне нужно следующее - моя клиентская программа запускается с локального компа, лезет в инет и дергает конкретный линк этого скрипта, который рыщет по заданным страницам и возвращает инфу в установленном формает клиенту, клиент отображает.


 
Palladin ©   (2004-09-16 21:26) [1]

А в каком виде ты себе представляешь готовое решение?


 
lipskiy ©   (2004-09-16 21:30) [2]

в виде скрипта, исходника, но с комментариями для чайников


 
Palladin ©   (2004-09-16 21:35) [3]

Если ты попытаешься формализировать свою хотелку, то ничего кроме дерева тегов не получишь... Это HTML, и он и так уже простой.


 
lipskiy ©   (2004-09-16 21:41) [4]


> Palladin ©   (16.09.04 21:35) [3]

Я не понял, теги почистить и по определнным критериям выдрать текстовую инфу - это что, проблема? Просто я не хочу чтоб на локальный комп грузилась вся страница, а чтоб на стороне сервера скрипт выдрал только необходимое.


 
Palladin ©   (2004-09-16 21:44) [5]

Условия для фильтрования HTML по определенным критериям строятся именно на тэгах. Это первое. Второе. Скрипт то тут причем? Мне казалось ты хочешь html распарсить а не скрипт text/plain написать.


 
DiamondShark ©   (2004-09-16 21:57) [6]

Я делал так: загружается HTML в парсер, приводится к well-formed виду, а потом при помощи XSLT выворачивается как угодно.


 
хм ©   (2004-09-16 22:17) [7]

регэкспы перла для этого удобны


 
lipskiy ©   (2004-09-16 22:20) [8]

Так. я в веб-программировании профан, поэтому наверное изъясняюсь неважно. Попробую снова: я хочу распарсить HTML на стороне сервера и получить в клиент чистые данные. Клиент пишу я, парсер (серверный) я написать не смогу, он мне и нужен в виде нечта готового.

> DiamondShark ©   (16.09.04 21:57) [6]

Где парсер? На локальной машине? Мне это не подходит, такой способ мне и так известен. Распарсить html на дельфях я могу, но дельфовую программу на сервере не запустишь!


 
lipskiy ©   (2004-09-16 22:21) [9]


> регэкспы перла для этого удобны

нисколько не сомневаюсь. но я не знаю на перла, ни пхп, ни яваскрипт. тем не менее я самолично качал готовые скрипты и встраивал их в своих страницы сайта, то есть не зная языка я пользовался скриптами. здесь мне нужно тоже самое.


 
DiamondShark ©   (2004-09-16 22:30) [10]


> lipskiy ©   (16.09.04 22:20) [8]

А хтмл у твоего серверного скриппта откуда берётся?

Какой сервер?

Что тебе доступно на срвере?


 
lipskiy ©   (2004-09-16 23:18) [11]


> А хтмл у твоего серверного скриппта откуда берётся?

Он сам должен загрузить себе указанную заранее страницу.

> Какой сервер?

Не знаю какой, платный хостинг, поддержка явыскрипт и пхп есть.

> Что тебе доступно на срвере?

А фиг знает, я могу только в тарифе своем посмотреть, че там конкретно разрешено. Собст-но, что требуется-то?



Страницы: 1 вся ветка

Форум: "Потрепаться";
Текущий архив: 2004.10.03;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.47 MB
Время: 0.042 c
4-1093451780
Роман
2004-08-25 20:36
2004.10.03
опять список всех окон запущенных в системе


3-1094113603
denisww
2004-09-02 12:26
2004.10.03
Нужна помосчь


6-1087729568
Сергей Г
2004-06-20 15:06
2004.10.03
Internet & SMS


4-1093110717
spoyler
2004-08-21 21:51
2004.10.03
Дни недели


1-1095348320
Antonm
2004-09-16 19:25
2004.10.03
Перетаскивание формы





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский