Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2004.01.09;
Скачать: [xml.tar.bz2];

Вниз

RTF2HTML   Найти похожие ветки 

 
vidiv   (2003-12-20 09:59) [0]

Есть RTF(DOC) файл (с таблицами и картинками), как его можно конвертировать в формат HTML (картинки сохранить отдельно), но таким образом чтобы код получился чистым.

По идее Word может это делать, но столько грязи вроде xml css и т.п.


 
TUser   (2003-12-20 11:18) [1]

css - это не грязь, это очень хорошо, т.к. html текст получится короче. Если будешь создавать html, то лучше предварительно проанализирей текст. Скорее всего удастся выделить элементы, типа class = myclass1 и т.д. А потом надо записать Html текст.


 
vidiv   (2003-12-20 11:40) [2]

TUser
Дело в том что мне нужно преобразовать много статей в формате DOC в формат HTML, при этом оформить в едином стиле, а все статьи оформлены по разному, и нужно их свести в один стиль.

самое оптимальное вообще убрать все теги и вставить <br> где надо, но мешает тот факт что в статьях встречаются картнки и таблицы


 
nikkie   (2003-12-20 14:43) [3]

>столько грязи вроде xml css
word97 без этого обходится. это более поздние таким увлекаются. все равно, конечно, у word97 свои заморочки есть.

>css - это не грязь, это очень хорошо
если бы ты видел HTML сделанный вордом, ты бы так не говорил. вчера только наблюдал страничку сделанную в word2000 (студентка моя сделала):
http://shar-vivace.by.ru
интересно, в состоянии ли другие браузеры правильно показать такую страницу. но и у IE с ней заморочки: картинки показывает, ссылки работают, но посмотреть свойства картинки или сохранить ее не получается, на картинках-ссылках курсор-пальчик не показывается...

если программно делать конвертацию текста RTF->HTML (просто используешь SelStart, SelLength, SelAttributes у TRichEdit), то проблем совсем никаких. с картинками в RTF я не работал, но по идее не архисложно должно быть. таблички - думаю проблемы будут, вряд ли RichEdit будет в состоянии с ними работать.

но я так понял, что надо это надо просто 1 раз сделать, а не написать программу, которая это будет делать всегда? я думаю, имеет смысл конвертнуть с помощью word97, а потом подумать на тему улучшения получившегося html.


 
TUser   (2003-12-20 20:15) [4]

Да, word сваял страничку на славу. homepage, вроде, простельнкий, но в исходниках html без поллитры не разберешься. Но я говорил про генерацию html текста ручками, думаю, что css жизнь будет сильно облегчать.
Та задача, которая поставлена - это по сути макетирование. Скорее быстрее все сделать руками, если нельзя как-нибудь просто определить, где заголовок, а где еще что-то. Кнут писал свою систему Tex 7 лет, если не ошиабюсь.


 
BorH   (2003-12-21 01:31) [5]

Народ, это всё конечно, хорошо, но может кто знает, как сохранить текст из RichEditа в HTML файл???


 
nikkie   (2003-12-21 01:35) [6]

я знаю.


 
TUser   (2003-12-21 11:10) [7]

2 BorH © (21.12.03 01:31) [5]
В Jedi есть компонент JvRTF2HTML. Правда, с русскими буквами у него глюки бывают.


 
vidiv   (2003-12-21 15:54) [8]

Сейчас задача состоит в том чтобы конвертировать пока 4 документа, будут еще. По идее это электронный журнал. Раньше статьи были без таблиц, и картинки были редкостью, а сейчас, по 25 и более таблиц в документе, вот я и решил облегчить себе жизнь. Насколько я знаю tRichEdit не понимает картинки (вообще ole объекты). но в RX все работает. Думаю это действительно не архисложно. Если у когонибудь есть дока по поводу работы с rtf через этот компонент(rxRichEdit), а именно с таблицами и картинками, дайте пожалуйста, буду благодарен!


 
vidiv   (2003-12-21 15:54) [9]

Сейчас задача состоит в том чтобы конвертировать пока 4 документа, будут еще. По идее это электронный журнал. Раньше статьи были без таблиц, и картинки были редкостью, а сейчас, по 25 и более таблиц в документе, вот я и решил облегчить себе жизнь. Насколько я знаю tRichEdit не понимает картинки (вообще ole объекты). но в RX все работает. Думаю это действительно не архисложно. Если у когонибудь есть дока по поводу работы с rtf через этот компонент(rxRichEdit), а именно с таблицами и картинками, дайте пожалуйста, буду благодарен!


 
TUser   (2003-12-21 19:25) [10]

Насколько я понимаю, тебе статьи приносят в формате doc или rtf. Открывай их в ворде через ole, читай своей программой текст, анализируй его и формируй html код. Не надо их в RichEdit грузить. Можно из jedi код взять и как-нибудь его модифицировать под твои потребности, но сомневаюсь, что это проще.


 
vidiv   (2003-12-22 11:12) [11]

TUser © (21.12.03 19:25) [10]
А есть какая нибудь дока о том как работать с текстом ворда через ole? Имеется ввиду описание методов и параметров?? даже на vb и c++ пойдет... буду благодарен


 
Думкин   (2003-12-22 11:20) [12]

> [11] vidiv © (22.12.03 11:12)

Есть. Сделай все нужные действия при записи макроса - потом посмотри макрос.


 
Anatoly Podgoretsky   (2003-12-22 11:25) [13]

Справка по VBA в самом Ворде


 
vidiv   (2003-12-22 14:28) [14]

Думкин © (22.12.03 11:20) [12] , Anatoly Podgoretsky © (22.12.03 11:25) [13]
Спасибо, думаю тема исчерпана... буду разбираться...



Страницы: 1 вся ветка

Форум: "Основная";
Текущий архив: 2004.01.09;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.48 MB
Время: 0.01 c
3-25246
Gandrey
2003-12-08 16:22
2004.01.09
uniqueidentifier и UpdateSQL


1-25322
romeo
2003-12-22 00:28
2004.01.09
Как сделать, чтобы открытый ComboBox не закрывался при Click e?


14-25594
Красная Майка
2003-12-17 14:45
2004.01.09
Есть предложение прокатиться... MRMP 8)


1-25442
vasyaVN
2003-12-23 14:33
2004.01.09
Можно ли вообще избежать в TCustomControl отрисовки?


1-25389
Goida
2003-12-25 16:23
2004.01.09
ExcelApplication





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский