TwebBrowser

← →
Sergioni (2006-09-05 23:25) [0]

Привет Мастерам!
как из TwebBrowser вытащить весь видимый текст независимо от сложности страницы?

← →
palva © (2006-09-05 23:30) [1]

Скорее всего никак. Если FineReader подключить... Но на картинках текст может быть намеренно кривым и зашумленным, так что не справится и FineReader.

← →
Sergioni (2006-09-05 23:48) [2]

я не про текст на картинках, а про обычный текст, который выделить можно, но получить весь нужно без выделения.....

← →
palva © (2006-09-05 23:56) [3]

Я могу снова сказать, что это невозможно, но вы ведь снова измените вопрос упростив задачу.

← →
RUNaum © (2006-09-06 06:12) [4]

а почему не возможно то? получаешь исходный текст страницы, парсишь, анализируешь (с учетом тэгов и т.д.) и можешь выдать именно видимый текст.

← →
MBo © (2006-09-06 08:01) [5]

http://www.swissdelphicenter.ch/en/tipsindex.php
Search tip: webbrowser

> парсишь, анализируешь (с учетом тэгов и т.д.)
Будет очень сложная программа: ведь могут быть скрипты, может быть частично видимый, заслоненный или нечитаемый текст, может быть текст, который показывается раз в час в течение пяти секунд (и в этот момент его можно выделить). Могут быть куски текста с таким расположением, что очень трудно решить, что за чем следует. Если вы напишете программу анализа, наверно, можно придумать что-нибудь еще, чтобы программа анализа сработала неправильно.

← →
Попов Виталий (2006-09-07 17:35) [7]

Вроде можно. Точно не помню, но надо использовать DOM. Что-то вроде такого:
Doc := WebBrowser.Document as IHTMLDocument2;
Text := Doc.InnerText; //Или OuterText

> [7] Попов Виталий (07.09.06 17:35)

Это будет весь текст, а не "весь видимый текст"

TwebBrowser Найти похожие ветки