Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2009.03.15;
Скачать: CL | DM;

Вниз

парсинг?   Найти похожие ветки 

 
html   (2009-01-26 14:11) [0]

Всем привет!
Имеется страница html(любая!).

Нужно вытащить из нее только главный текст. Главный текст - например, если на странице статья о Васе Пупкине, то нужен только текст этой статьи, все остальное отсеивается.

вот отсюда: http://www.svobodanews.ru/Transcript/2009/01/26/20090126133638527.html

нужен текст статьи "В Страсбурге открывается зимняя сессия ПАСЕ".

Это вообще реально сделать? Если да, то как?


 
Медвежонок Пятачок ©   (2009-01-26 14:17) [1]

Имеется страница html(любая!).

Нужно вытащить из нее только главный текст. Главный текст - например, если на странице статья о Васе Пупкине, то нужен только текст этой статьи, все остальное отсеивается.

Это вообще реально сделать? Если да, то как?

нереально.
в любой странице может не быть никакой статьи.
а может быть сто статей.


 
html   (2009-01-26 14:19) [2]


> Медвежонок Пятачок ©   (26.01.09 14:17) [1]

немного не так выразился(
статья есть
она одна

только странички с разных сайтов. Как мне "научить" программу, выделять только текст статьи?


 
Anatoly Podgoretsky ©   (2009-01-26 14:22) [3]

> html  (26.01.2009 14:19:02)  [2]

В такой постановке ни как, структура страницы может быть любой сложности.


 
Ega23 ©   (2009-01-26 14:25) [4]

всё Body может состоять из одного-единственного div-а. А сама страница - в динамике подгружается.


 
html   (2009-01-26 14:25) [5]


> Anatoly Podgoretsky ©   (26.01.09 14:22) [3]

Спасибо, так и сам думал, но надежда умирает известно в какую очередь...


 
html   (2009-01-26 14:26) [6]


> Ega23 ©   (26.01.09 14:25) [4]

если бы...



Страницы: 1 вся ветка

Текущий архив: 2009.03.15;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.014 c
2-1233124341
HandBrake
2009-01-28 09:32
2009.03.15
BDE + Paradox + WinXP + перекодировка


2-1232640965
web-rider
2009-01-22 19:16
2009.03.15
Косячок с отправкой писем на мыло


15-1231427254
loki_6681
2009-01-08 18:07
2009.03.15
Экспорт данных из Foxpro


10-1153497317
TStas
2006-07-21 19:55
2009.03.15
Как добраться до колонтитула в Ворде?


15-1231263856
Кое кто
2009-01-06 20:44
2009.03.15
Большой архив маленьких английских рассказов...