Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2006.10.15;
Скачать: CL | DM;

Вниз

TwebBrowser   Найти похожие ветки 

 
Sergioni   (2006-09-05 23:25) [0]

Привет Мастерам!
как из TwebBrowser вытащить весь видимый текст независимо от сложности страницы?


 
palva ©   (2006-09-05 23:30) [1]

Скорее всего никак. Если FineReader подключить... Но на картинках текст может быть намеренно кривым и зашумленным, так что не справится и FineReader.


 
Sergioni   (2006-09-05 23:48) [2]

я не про текст на картинках, а про обычный текст, который выделить можно, но получить весь нужно без выделения.....


 
palva ©   (2006-09-05 23:56) [3]

Я могу снова сказать, что это невозможно, но вы ведь снова измените вопрос упростив задачу.


 
RUNaum ©   (2006-09-06 06:12) [4]

а почему не возможно то? получаешь исходный текст страницы, парсишь, анализируешь (с учетом тэгов и т.д.) и можешь выдать именно видимый текст.


 
MBo ©   (2006-09-06 08:01) [5]

http://www.swissdelphicenter.ch/en/tipsindex.php
Search tip: webbrowser


 
palva ©   (2006-09-06 10:07) [6]

> парсишь, анализируешь (с учетом тэгов и т.д.)
Будет очень сложная программа: ведь могут быть скрипты, может быть частично видимый, заслоненный или нечитаемый текст, может быть текст, который показывается раз в час в течение пяти секунд (и в этот момент его можно выделить). Могут быть куски текста с таким расположением, что очень трудно решить, что за чем следует. Если вы напишете программу анализа, наверно, можно придумать что-нибудь еще, чтобы программа анализа сработала неправильно.


 
Попов Виталий   (2006-09-07 17:35) [7]

Вроде можно. Точно не помню, но надо использовать DOM. Что-то вроде такого:
Doc := WebBrowser.Document as IHTMLDocument2;
Text := Doc.InnerText; //Или OuterText


 
evvcom ©   (2006-09-07 17:56) [8]

> [7] Попов Виталий   (07.09.06 17:35)

Это будет весь текст, а не "весь видимый текст"



Страницы: 1 вся ветка

Текущий архив: 2006.10.15;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.075 c
4-1148996843
liavik
2006-05-30 17:47
2006.10.15
Позиии приложений


3-1155811000
Lilia
2006-08-17 14:36
2006.10.15
Просмотр данных таблицы через DBCombobox


2-1159520821
Term
2006-09-29 13:07
2006.10.15
Может туплю


15-1159285640
EkZot
2006-09-26 19:47
2006.10.15
грани на изображении


3-1156101812
Lexander
2006-08-20 23:23
2006.10.15
Ошибка "Запись удалена" (Access)