Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2004.01.09;
Скачать: CL | DM;

Вниз

RTF2HTML   Найти похожие ветки 

 
vidiv ©   (2003-12-20 09:59) [0]

Есть RTF(DOC) файл (с таблицами и картинками), как его можно конвертировать в формат HTML (картинки сохранить отдельно), но таким образом чтобы код получился чистым.

По идее Word может это делать, но столько грязи вроде xml css и т.п.


 
TUser ©   (2003-12-20 11:18) [1]

css - это не грязь, это очень хорошо, т.к. html текст получится короче. Если будешь создавать html, то лучше предварительно проанализирей текст. Скорее всего удастся выделить элементы, типа class = myclass1 и т.д. А потом надо записать Html текст.


 
vidiv ©   (2003-12-20 11:40) [2]

TUser
Дело в том что мне нужно преобразовать много статей в формате DOC в формат HTML, при этом оформить в едином стиле, а все статьи оформлены по разному, и нужно их свести в один стиль.

самое оптимальное вообще убрать все теги и вставить <br> где надо, но мешает тот факт что в статьях встречаются картнки и таблицы


 
nikkie ©   (2003-12-20 14:43) [3]

>столько грязи вроде xml css
word97 без этого обходится. это более поздние таким увлекаются. все равно, конечно, у word97 свои заморочки есть.

>css - это не грязь, это очень хорошо
если бы ты видел HTML сделанный вордом, ты бы так не говорил. вчера только наблюдал страничку сделанную в word2000 (студентка моя сделала):
http://shar-vivace.by.ru
интересно, в состоянии ли другие браузеры правильно показать такую страницу. но и у IE с ней заморочки: картинки показывает, ссылки работают, но посмотреть свойства картинки или сохранить ее не получается, на картинках-ссылках курсор-пальчик не показывается...

если программно делать конвертацию текста RTF->HTML (просто используешь SelStart, SelLength, SelAttributes у TRichEdit), то проблем совсем никаких. с картинками в RTF я не работал, но по идее не архисложно должно быть. таблички - думаю проблемы будут, вряд ли RichEdit будет в состоянии с ними работать.

но я так понял, что надо это надо просто 1 раз сделать, а не написать программу, которая это будет делать всегда? я думаю, имеет смысл конвертнуть с помощью word97, а потом подумать на тему улучшения получившегося html.


 
TUser ©   (2003-12-20 20:15) [4]

Да, word сваял страничку на славу. homepage, вроде, простельнкий, но в исходниках html без поллитры не разберешься. Но я говорил про генерацию html текста ручками, думаю, что css жизнь будет сильно облегчать.
Та задача, которая поставлена - это по сути макетирование. Скорее быстрее все сделать руками, если нельзя как-нибудь просто определить, где заголовок, а где еще что-то. Кнут писал свою систему Tex 7 лет, если не ошиабюсь.


 
BorH ©   (2003-12-21 01:31) [5]

Народ, это всё конечно, хорошо, но может кто знает, как сохранить текст из RichEditа в HTML файл???


 
nikkie ©   (2003-12-21 01:35) [6]

я знаю.


 
TUser ©   (2003-12-21 11:10) [7]

2 BorH © (21.12.03 01:31) [5]
В Jedi есть компонент JvRTF2HTML. Правда, с русскими буквами у него глюки бывают.


 
vidiv ©   (2003-12-21 15:54) [8]

Сейчас задача состоит в том чтобы конвертировать пока 4 документа, будут еще. По идее это электронный журнал. Раньше статьи были без таблиц, и картинки были редкостью, а сейчас, по 25 и более таблиц в документе, вот я и решил облегчить себе жизнь. Насколько я знаю tRichEdit не понимает картинки (вообще ole объекты). но в RX все работает. Думаю это действительно не архисложно. Если у когонибудь есть дока по поводу работы с rtf через этот компонент(rxRichEdit), а именно с таблицами и картинками, дайте пожалуйста, буду благодарен!


 
vidiv ©   (2003-12-21 15:54) [9]

Сейчас задача состоит в том чтобы конвертировать пока 4 документа, будут еще. По идее это электронный журнал. Раньше статьи были без таблиц, и картинки были редкостью, а сейчас, по 25 и более таблиц в документе, вот я и решил облегчить себе жизнь. Насколько я знаю tRichEdit не понимает картинки (вообще ole объекты). но в RX все работает. Думаю это действительно не архисложно. Если у когонибудь есть дока по поводу работы с rtf через этот компонент(rxRichEdit), а именно с таблицами и картинками, дайте пожалуйста, буду благодарен!


 
TUser ©   (2003-12-21 19:25) [10]

Насколько я понимаю, тебе статьи приносят в формате doc или rtf. Открывай их в ворде через ole, читай своей программой текст, анализируй его и формируй html код. Не надо их в RichEdit грузить. Можно из jedi код взять и как-нибудь его модифицировать под твои потребности, но сомневаюсь, что это проще.


 
vidiv ©   (2003-12-22 11:12) [11]

TUser © (21.12.03 19:25) [10]
А есть какая нибудь дока о том как работать с текстом ворда через ole? Имеется ввиду описание методов и параметров?? даже на vb и c++ пойдет... буду благодарен


 
Думкин ©   (2003-12-22 11:20) [12]

> [11] vidiv © (22.12.03 11:12)

Есть. Сделай все нужные действия при записи макроса - потом посмотри макрос.


 
Anatoly Podgoretsky ©   (2003-12-22 11:25) [13]

Справка по VBA в самом Ворде


 
vidiv ©   (2003-12-22 14:28) [14]

Думкин © (22.12.03 11:20) [12] , Anatoly Podgoretsky © (22.12.03 11:25) [13]
Спасибо, думаю тема исчерпана... буду разбираться...



Страницы: 1 вся ветка

Текущий архив: 2004.01.09;
Скачать: CL | DM;

Наверх




Память: 0.5 MB
Время: 0.021 c
14-25583
Вася Добрый
2003-12-17 10:52
2004.01.09
IBExpert+Firebird


3-25195
Gamar
2003-12-12 07:28
2004.01.09
Обновить быстро


1-25350
Александр Мих
2003-12-22 11:01
2004.01.09
Инициализация переменных


1-25297
Тимохов
2003-12-16 14:20
2004.01.09
Правила вызова AddRef


4-25651
Колян_К
2003-11-06 12:14
2004.01.09
Что делает mouse.destroy;