Форум: "Начинающим";
Текущий архив: 2009.03.15;
Скачать: [xml.tar.bz2];
Внизпарсинг? Найти похожие ветки
← →
html (2009-01-26 14:11) [0]Всем привет!
Имеется страница html(любая!).
Нужно вытащить из нее только главный текст. Главный текст - например, если на странице статья о Васе Пупкине, то нужен только текст этой статьи, все остальное отсеивается.
вот отсюда: http://www.svobodanews.ru/Transcript/2009/01/26/20090126133638527.html
нужен текст статьи "В Страсбурге открывается зимняя сессия ПАСЕ".
Это вообще реально сделать? Если да, то как?
← →
Медвежонок Пятачок © (2009-01-26 14:17) [1]Имеется страница html(любая!).
Нужно вытащить из нее только главный текст. Главный текст - например, если на странице статья о Васе Пупкине, то нужен только текст этой статьи, все остальное отсеивается.
Это вообще реально сделать? Если да, то как?
нереально.
в любой странице может не быть никакой статьи.
а может быть сто статей.
← →
html (2009-01-26 14:19) [2]
> Медвежонок Пятачок © (26.01.09 14:17) [1]
немного не так выразился(
статья есть
она одна
только странички с разных сайтов. Как мне "научить" программу, выделять только текст статьи?
← →
Anatoly Podgoretsky © (2009-01-26 14:22) [3]> html (26.01.2009 14:19:02) [2]
В такой постановке ни как, структура страницы может быть любой сложности.
← →
Ega23 © (2009-01-26 14:25) [4]всё Body может состоять из одного-единственного div-а. А сама страница - в динамике подгружается.
← →
html (2009-01-26 14:25) [5]
> Anatoly Podgoretsky © (26.01.09 14:22) [3]
Спасибо, так и сам думал, но надежда умирает известно в какую очередь...
← →
html (2009-01-26 14:26) [6]
> Ega23 © (26.01.09 14:25) [4]
если бы...
Страницы: 1 вся ветка
Форум: "Начинающим";
Текущий архив: 2009.03.15;
Скачать: [xml.tar.bz2];
Память: 0.45 MB
Время: 0.056 c