извлечь текст из html страницы.без html-тегов

← →
vista (2005-12-27 10:31) [0]

как извлечь только текст который отображает броузер...
т.е. только текст без html-тегов.

← →
Sysanin (2005-12-27 16:20) [1]

Ну один из вариантов во всём HTML-документе удалить текст между < и >, и между <script и </script>

← →
vista (2005-12-28 04:38) [2]

Вот попробовал совет, получилось, но не то что представлял, но если поработать немножко, то можно сделать текстовый броузер без графики. Спасибо за совет, Мастера, как то не доходило, а это проще простого.

var
s:string;
st,en:integer;
begin
Memo1.Lines.LoadFromFile("C:\index.htm");
s:=Memo1.Text;
st:=1;
while st<>0 do
begin
st:=pos("<",s);
en:=pos(">",s) + 1;
Delete(s,st,en-st);
end;
memo2.text:=s;
end;

← →
ZeFiR © (2005-12-28 19:56) [3]

uses mshtml, activex; procedure GetHtmlCode(WebBrowser: TWebBrowser; FileName: string); var htmlDoc: IHtmlDocument2; PersistFile: IPersistFile; begin htmlDoc := WebBrowser.document as IHtmlDocument2; PersistFile := HTMLDoc as IPersistFile; PersistFile.save(StringToOleStr(FileName), true); end;
или
var Document: IHTMLDocument2; begin Document := WB.Document as IHtmlDocument2; if Document < > nil then Memo1.Text := (Document.all.Item(NULL, 0) as IHTMLElement).OuterHTML;

ZeFiR
до второго способа я не догадался=) большое спасибо за совет=) первый способ с фреймами не работает

извлечь текст из html страницы.без html-тегов Найти похожие ветки