Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2006.10.15;
Скачать: CL | DM;

Вниз

TwebBrowser   Найти похожие ветки 

 
Sergioni   (2006-09-05 23:25) [0]

Привет Мастерам!
как из TwebBrowser вытащить весь видимый текст независимо от сложности страницы?


 
palva ©   (2006-09-05 23:30) [1]

Скорее всего никак. Если FineReader подключить... Но на картинках текст может быть намеренно кривым и зашумленным, так что не справится и FineReader.


 
Sergioni   (2006-09-05 23:48) [2]

я не про текст на картинках, а про обычный текст, который выделить можно, но получить весь нужно без выделения.....


 
palva ©   (2006-09-05 23:56) [3]

Я могу снова сказать, что это невозможно, но вы ведь снова измените вопрос упростив задачу.


 
RUNaum ©   (2006-09-06 06:12) [4]

а почему не возможно то? получаешь исходный текст страницы, парсишь, анализируешь (с учетом тэгов и т.д.) и можешь выдать именно видимый текст.


 
MBo ©   (2006-09-06 08:01) [5]

http://www.swissdelphicenter.ch/en/tipsindex.php
Search tip: webbrowser


 
palva ©   (2006-09-06 10:07) [6]

> парсишь, анализируешь (с учетом тэгов и т.д.)
Будет очень сложная программа: ведь могут быть скрипты, может быть частично видимый, заслоненный или нечитаемый текст, может быть текст, который показывается раз в час в течение пяти секунд (и в этот момент его можно выделить). Могут быть куски текста с таким расположением, что очень трудно решить, что за чем следует. Если вы напишете программу анализа, наверно, можно придумать что-нибудь еще, чтобы программа анализа сработала неправильно.


 
Попов Виталий   (2006-09-07 17:35) [7]

Вроде можно. Точно не помню, но надо использовать DOM. Что-то вроде такого:
Doc := WebBrowser.Document as IHTMLDocument2;
Text := Doc.InnerText; //Или OuterText


 
evvcom ©   (2006-09-07 17:56) [8]

> [7] Попов Виталий   (07.09.06 17:35)

Это будет весь текст, а не "весь видимый текст"



Страницы: 1 вся ветка

Текущий архив: 2006.10.15;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.035 c
3-1155197685
rsa_
2006-08-10 12:14
2006.10.15
TntUnicodeControls... не получается то, что необходимо


15-1158922242
VitV
2006-09-22 14:50
2006.10.15
Необходимые библиотеки для VB6


2-1159388288
KidMan
2006-09-28 00:18
2006.10.15
Как сделать, чтобы к письму прикреплялся файл


2-1159290580
Ezorcist
2006-09-26 21:09
2006.10.15
Вызов процедур функций другого юнита.


1-1155619531
el-eXtremo
2006-08-15 09:25
2006.10.15
есть ли модули по редактированию xml