Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2006.04.09;
Скачать: CL | DM;

Вниз

извлечь текст из html страницы.без html-тегов   Найти похожие ветки 

 
vista   (2005-12-27 10:31) [0]

как извлечь только текст который отображает броузер...
т.е. только текст без html-тегов.


 
Sysanin   (2005-12-27 16:20) [1]

Ну один из вариантов во всём HTML-документе удалить текст между < и >, и между <script  и </script>


 
vista   (2005-12-28 04:38) [2]

Вот попробовал совет, получилось, но не то что представлял, но если поработать немножко, то можно сделать текстовый броузер без графики. Спасибо за совет, Мастера, как то не доходило, а это проще простого.

var
       s:string;
       st,en:integer;
begin
Memo1.Lines.LoadFromFile("C:\index.htm");
s:=Memo1.Text;
st:=1;
while st<>0 do
begin
 st:=pos("<",s);
 en:=pos(">",s) + 1;
 Delete(s,st,en-st);
end;
memo2.text:=s;
end;


 
ZeFiR ©   (2005-12-28 19:56) [3]

uses mshtml, activex;

procedure GetHtmlCode(WebBrowser: TWebBrowser; FileName: string);
var
htmlDoc: IHtmlDocument2;
PersistFile: IPersistFile;
begin
htmlDoc := WebBrowser.document as IHtmlDocument2;
PersistFile := HTMLDoc as IPersistFile;
PersistFile.save(StringToOleStr(FileName), true);
end;

или
var
 Document: IHTMLDocument2;
begin
Document := WB.Document as IHtmlDocument2;
if Document < >  nil then
  Memo1.Text := (Document.all.Item(NULL, 0) as IHTMLElement).OuterHTML;


 
0xBAD ©   (2005-12-28 20:26) [4]

ZeFiR
до второго способа я не догадался=) большое спасибо за совет=) первый способ с фреймами не работает



Страницы: 1 вся ветка

Текущий архив: 2006.04.09;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.066 c
1-1141920092
Fenix
2006-03-09 19:01
2006.04.09
Динамическое создание разделов меню


8-1130618516
SergProger
2005-10-30 00:41
2006.04.09
Структура gif.


2-1143434756
nyron
2006-03-27 08:45
2006.04.09
поиск по форме


3-1139570207
vajo
2006-02-10 14:16
2006.04.09
Ошибка подключения IB базы из сети


1-1141359578
Lkan
2006-03-03 07:19
2006.04.09
вычислить время