Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2005.03.27;
Скачать: CL | DM;

Вниз

Html в TXT   Найти похожие ветки 

 
Wistful ©   (2005-03-13 11:39) [0]

В общем нужно написать программу которая преобразует Html в Txt c форматированием текста.
Т.е. в результате работы программы в текстовом файле должен содержаться текст соответствующий тексту в браузере.

Как это можно сделать?


 
Dell3r ©   (2005-03-13 12:23) [1]

Memo1.lines.loadfromfile("C:\MyHTML.html");
Здесь стираешь все тэги.
Memo1.lines.savetofile("C:\MyHTML.txt");


 
Gero ©   (2005-03-13 13:10) [2]


> в Txt c форматированием текста

txt не поддерживает форматирование текста.


 
Gero ©   (2005-03-13 13:11) [3]

А вобще лучше всего сдлеать это через браузер, тогда соответствовать тексту в браузере будет наверняка.


 
Dell3r ©   (2005-03-13 13:14) [4]

Поддерживает форматирование текста только пользователь. Потом если это надоедает, то он изучает программирование, а только потом пишет программы.


 
Anatoly Podgoretsky ©   (2005-03-13 13:34) [5]

Wistful ©   (13.03.05 11:39)  
c форматированием текста.

Расшифруй насчет форматирования текста, насколько мне известно все форматирование ограничивается количество пробелов, табуляций и пустых строк.
Что именно и как предполагается форматировать?


 
zero-g ©   (2005-03-13 13:48) [6]

// offtop

Мдя.... и здесь до сил русского языка добрались...

to Anatoly Podgoretsky
А вы можете объяснять, если видите ошибку в написании, в смысловой нагрузке? А не задавать вопросы косательно русского языка, лексичесого значения (надаюсь в этот раз угадал)...
А то складывается впечатление, что вам малось черепная коробка жмет... Зарание прошу прошение за такое сравнение. Это было сказано без злово умысла


 
Gero ©   (2005-03-13 13:54) [7]


> zero-g ©   (13.03.05 13:48)

Что тебе не нравится?
Ты хоть понял о чем речь?

Все-таки иногда лучше жевать…


 
begin...end ©   (2005-03-13 14:01) [8]

Что сегодня за день такой? Уже в 4-х ветках вижу какие-то разборки...


 
Dell3r ©   (2005-03-13 14:04) [9]

Воскресение. Все пытаются высказать все накопившееся за неделю.


 
zero-g ©   (2005-03-13 14:11) [10]

Прошу прощение за все!

Как ни как чегодня прошенное воскресенье :)

to Gero

Я то понял.
Просто фишка в другом.

Ну да ладно, забыли!

Как уже написал выше, извиняюсь!


 
Wistful ©   (2005-03-14 00:04) [11]

Народ, хватит ругаться.
"преобразует Html в Txt c форматированием текста"
этим выражением я хотел сказать что в результате текст должен быть в нормальном виде, т.е. можно удалить все тэги и ерунда одна. Мне же нужно что бы вид текста был как в браузере.

Gero ©   (13.03.05 13:11) [3]
А вобще лучше всего сдлеать это через браузер, тогда соответствовать тексту в браузере будет наверняка.

Программа должна каждый час скачивать документ, не буду же я каждый час загружать страничку в браузере и затем сохранять ее в TXT


 
Gero ©   (2005-03-14 00:15) [12]


> не буду же я каждый час загружать страничку в браузере и
> затем сохранять ее в TXT

Говоря «в браузере» я подразумевал «в браузере, встроенном в твою программу».
TWebBrowser, короче говоря.


 
wistful ©   (2005-03-14 00:22) [13]

Gero ©   (14.03.05 00:15) [12]
днем попробую, хотя ни разу не пользовался TWebBrowser. Будем разбираться.


 
Gero ©   (2005-03-14 02:34) [14]


> wistful ©   (14.03.05 00:22)

В таком случае попытаюсь тебе помочь.


uses MSHTML, ActiveX;

procedure TForm1.SaveToTxtFile(const FileName: string);
var
 Doc: IHtmlDocument2;
 PersistFile: IPersistFile;
begin
 Doc := WebBrowser.Document as IHtmlDocument2;
 PersistFile := Doc as IPersistFile;
 PersistFile.Save(StringToOleStr(FileName), True);
end;


WebBrowser1 — экземпляр класса TWebBrowser.

Сначала делаешь загружаешь страницу в браузер методом Navigate, потом сохраняешь его методом формы SaveToTxtFile.
Короче, все просто до безобразия.


 
Gero ©   (2005-03-14 02:35) [15]


> WebBrowser1

То есть просто WebBrowser.


 
Wistful ©   (2005-03-14 19:26) [16]

Gero, большое спасибо. Все работает почти нормально(текст не совсем соответствует виду в браузере, но енто уже мелочи).



Страницы: 1 вся ветка

Текущий архив: 2005.03.27;
Скачать: CL | DM;

Наверх




Память: 0.5 MB
Время: 0.065 c
3-1109272038
koderman
2005-02-24 22:07
2005.03.27
Выбрать все записи начинающиеся на определенную букву.


4-1108617530
r.o.o.t
2005-02-17 08:18
2005.03.27
Файловая система


6-1106907685
ТехникПТО
2005-01-28 13:21
2005.03.27
OnNewWindow2 в динамически созданном браузере


1-1110411855
Silla
2005-03-10 02:44
2005.03.27
MDI Application


4-1108543060
Шурик Ш
2005-02-16 11:37
2005.03.27
Переменная среды TEMP