Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2006.04.09;
Скачать: CL | DM;

Вниз

извлечь текст из html страницы.без html-тегов   Найти похожие ветки 

 
vista   (2005-12-27 10:31) [0]

как извлечь только текст который отображает броузер...
т.е. только текст без html-тегов.


 
Sysanin   (2005-12-27 16:20) [1]

Ну один из вариантов во всём HTML-документе удалить текст между < и >, и между <script  и </script>


 
vista   (2005-12-28 04:38) [2]

Вот попробовал совет, получилось, но не то что представлял, но если поработать немножко, то можно сделать текстовый броузер без графики. Спасибо за совет, Мастера, как то не доходило, а это проще простого.

var
       s:string;
       st,en:integer;
begin
Memo1.Lines.LoadFromFile("C:\index.htm");
s:=Memo1.Text;
st:=1;
while st<>0 do
begin
 st:=pos("<",s);
 en:=pos(">",s) + 1;
 Delete(s,st,en-st);
end;
memo2.text:=s;
end;


 
ZeFiR ©   (2005-12-28 19:56) [3]

uses mshtml, activex;

procedure GetHtmlCode(WebBrowser: TWebBrowser; FileName: string);
var
htmlDoc: IHtmlDocument2;
PersistFile: IPersistFile;
begin
htmlDoc := WebBrowser.document as IHtmlDocument2;
PersistFile := HTMLDoc as IPersistFile;
PersistFile.save(StringToOleStr(FileName), true);
end;

или
var
 Document: IHTMLDocument2;
begin
Document := WB.Document as IHtmlDocument2;
if Document < >  nil then
  Memo1.Text := (Document.all.Item(NULL, 0) as IHTMLElement).OuterHTML;


 
0xBAD ©   (2005-12-28 20:26) [4]

ZeFiR
до второго способа я не догадался=) большое спасибо за совет=) первый способ с фреймами не работает



Страницы: 1 вся ветка

Текущий архив: 2006.04.09;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.027 c
1-1140553994
Дубинка
2006-02-21 23:33
2006.04.09
Автозапуск dll


11-1123317561
Serg777
2005-08-06 12:39
2006.04.09
Маска файла *.* и файл без расширения


15-1142939613
Карелин Артем
2006-03-21 14:13
2006.04.09
Установка программы на сотовый без компа.


2-1143045604
Fenix
2006-03-22 19:40
2006.04.09
Повернуть горизонтально TreeView


10-1115966812
Irishka
2005-05-13 10:46
2006.04.09
TIMAGE и WORD