Текущий архив: 2006.10.15;
Скачать: CL | DM;
ВнизTwebBrowser Найти похожие ветки
← →
Sergioni (2006-09-05 23:25) [0]Привет Мастерам!
как из TwebBrowser вытащить весь видимый текст независимо от сложности страницы?
← →
palva © (2006-09-05 23:30) [1]Скорее всего никак. Если FineReader подключить... Но на картинках текст может быть намеренно кривым и зашумленным, так что не справится и FineReader.
← →
Sergioni (2006-09-05 23:48) [2]я не про текст на картинках, а про обычный текст, который выделить можно, но получить весь нужно без выделения.....
← →
palva © (2006-09-05 23:56) [3]Я могу снова сказать, что это невозможно, но вы ведь снова измените вопрос упростив задачу.
← →
RUNaum © (2006-09-06 06:12) [4]а почему не возможно то? получаешь исходный текст страницы, парсишь, анализируешь (с учетом тэгов и т.д.) и можешь выдать именно видимый текст.
← →
MBo © (2006-09-06 08:01) [5]http://www.swissdelphicenter.ch/en/tipsindex.php
Search tip: webbrowser
← →
palva © (2006-09-06 10:07) [6]> парсишь, анализируешь (с учетом тэгов и т.д.)
Будет очень сложная программа: ведь могут быть скрипты, может быть частично видимый, заслоненный или нечитаемый текст, может быть текст, который показывается раз в час в течение пяти секунд (и в этот момент его можно выделить). Могут быть куски текста с таким расположением, что очень трудно решить, что за чем следует. Если вы напишете программу анализа, наверно, можно придумать что-нибудь еще, чтобы программа анализа сработала неправильно.
← →
Попов Виталий (2006-09-07 17:35) [7]Вроде можно. Точно не помню, но надо использовать DOM. Что-то вроде такого:
Doc := WebBrowser.Document as IHTMLDocument2;
Text := Doc.InnerText; //Или OuterText
← →
evvcom © (2006-09-07 17:56) [8]> [7] Попов Виталий (07.09.06 17:35)
Это будет весь текст, а не "весь видимый текст"
Страницы: 1 вся ветка
Текущий архив: 2006.10.15;
Скачать: CL | DM;
Память: 0.45 MB
Время: 0.038 c