Форум: "Основная";
Текущий архив: 2004.01.09;
Скачать: [xml.tar.bz2];
ВнизRTF2HTML Найти похожие ветки
← →
vidiv (2003-12-20 09:59) [0]Есть RTF(DOC) файл (с таблицами и картинками), как его можно конвертировать в формат HTML (картинки сохранить отдельно), но таким образом чтобы код получился чистым.
По идее Word может это делать, но столько грязи вроде xml css и т.п.
← →
TUser (2003-12-20 11:18) [1]css - это не грязь, это очень хорошо, т.к. html текст получится короче. Если будешь создавать html, то лучше предварительно проанализирей текст. Скорее всего удастся выделить элементы, типа class = myclass1 и т.д. А потом надо записать Html текст.
← →
vidiv (2003-12-20 11:40) [2]TUser
Дело в том что мне нужно преобразовать много статей в формате DOC в формат HTML, при этом оформить в едином стиле, а все статьи оформлены по разному, и нужно их свести в один стиль.
самое оптимальное вообще убрать все теги и вставить <br> где надо, но мешает тот факт что в статьях встречаются картнки и таблицы
← →
nikkie (2003-12-20 14:43) [3]>столько грязи вроде xml css
word97 без этого обходится. это более поздние таким увлекаются. все равно, конечно, у word97 свои заморочки есть.
>css - это не грязь, это очень хорошо
если бы ты видел HTML сделанный вордом, ты бы так не говорил. вчера только наблюдал страничку сделанную в word2000 (студентка моя сделала):
http://shar-vivace.by.ru
интересно, в состоянии ли другие браузеры правильно показать такую страницу. но и у IE с ней заморочки: картинки показывает, ссылки работают, но посмотреть свойства картинки или сохранить ее не получается, на картинках-ссылках курсор-пальчик не показывается...
если программно делать конвертацию текста RTF->HTML (просто используешь SelStart, SelLength, SelAttributes у TRichEdit), то проблем совсем никаких. с картинками в RTF я не работал, но по идее не архисложно должно быть. таблички - думаю проблемы будут, вряд ли RichEdit будет в состоянии с ними работать.
но я так понял, что надо это надо просто 1 раз сделать, а не написать программу, которая это будет делать всегда? я думаю, имеет смысл конвертнуть с помощью word97, а потом подумать на тему улучшения получившегося html.
← →
TUser (2003-12-20 20:15) [4]Да, word сваял страничку на славу. homepage, вроде, простельнкий, но в исходниках html без поллитры не разберешься. Но я говорил про генерацию html текста ручками, думаю, что css жизнь будет сильно облегчать.
Та задача, которая поставлена - это по сути макетирование. Скорее быстрее все сделать руками, если нельзя как-нибудь просто определить, где заголовок, а где еще что-то. Кнут писал свою систему Tex 7 лет, если не ошиабюсь.
← →
BorH (2003-12-21 01:31) [5]Народ, это всё конечно, хорошо, но может кто знает, как сохранить текст из RichEditа в HTML файл???
← →
nikkie (2003-12-21 01:35) [6]я знаю.
← →
TUser (2003-12-21 11:10) [7]2 BorH © (21.12.03 01:31) [5]
В Jedi есть компонент JvRTF2HTML. Правда, с русскими буквами у него глюки бывают.
← →
vidiv (2003-12-21 15:54) [8]Сейчас задача состоит в том чтобы конвертировать пока 4 документа, будут еще. По идее это электронный журнал. Раньше статьи были без таблиц, и картинки были редкостью, а сейчас, по 25 и более таблиц в документе, вот я и решил облегчить себе жизнь. Насколько я знаю tRichEdit не понимает картинки (вообще ole объекты). но в RX все работает. Думаю это действительно не архисложно. Если у когонибудь есть дока по поводу работы с rtf через этот компонент(rxRichEdit), а именно с таблицами и картинками, дайте пожалуйста, буду благодарен!
← →
vidiv (2003-12-21 15:54) [9]Сейчас задача состоит в том чтобы конвертировать пока 4 документа, будут еще. По идее это электронный журнал. Раньше статьи были без таблиц, и картинки были редкостью, а сейчас, по 25 и более таблиц в документе, вот я и решил облегчить себе жизнь. Насколько я знаю tRichEdit не понимает картинки (вообще ole объекты). но в RX все работает. Думаю это действительно не архисложно. Если у когонибудь есть дока по поводу работы с rtf через этот компонент(rxRichEdit), а именно с таблицами и картинками, дайте пожалуйста, буду благодарен!
← →
TUser (2003-12-21 19:25) [10]Насколько я понимаю, тебе статьи приносят в формате doc или rtf. Открывай их в ворде через ole, читай своей программой текст, анализируй его и формируй html код. Не надо их в RichEdit грузить. Можно из jedi код взять и как-нибудь его модифицировать под твои потребности, но сомневаюсь, что это проще.
← →
vidiv (2003-12-22 11:12) [11]TUser © (21.12.03 19:25) [10]
А есть какая нибудь дока о том как работать с текстом ворда через ole? Имеется ввиду описание методов и параметров?? даже на vb и c++ пойдет... буду благодарен
← →
Думкин (2003-12-22 11:20) [12]> [11] vidiv © (22.12.03 11:12)
Есть. Сделай все нужные действия при записи макроса - потом посмотри макрос.
← →
Anatoly Podgoretsky (2003-12-22 11:25) [13]Справка по VBA в самом Ворде
← →
vidiv (2003-12-22 14:28) [14]Думкин © (22.12.03 11:20) [12] , Anatoly Podgoretsky © (22.12.03 11:25) [13]
Спасибо, думаю тема исчерпана... буду разбираться...
Страницы: 1 вся ветка
Форум: "Основная";
Текущий архив: 2004.01.09;
Скачать: [xml.tar.bz2];
Память: 0.48 MB
Время: 0.01 c