Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2007.07.22;
Скачать: CL | DM;

Вниз

Из pdf а html   Найти похожие ветки 

 
DillerXX ©   (2007-06-19 20:31) [0]

Возможно ли сохранить pdf в html, doc, или иной формат, так чтобы было без потери всей информации? txt естественно не подходит...


 
Vendict ©   (2007-06-19 20:35) [1]

DillerXX ©   (19.06.07 20:31)
зачем ? pdf же платформонезависимый формат, везде будет читаться.


 
DillerXX ©   (2007-06-19 20:37) [2]

Не нашёл ридера для Sony Ericсson k750, поэтому решил разбить на несколько хтмл страниц, возможно с картинками.


 
Anatoly Podgoretsky ©   (2007-06-19 20:40) [3]

> Vendict  (19.06.2007 20:35:01)  [1]

Это только слова


 
palva ©   (2007-06-19 20:58) [4]

Бывают такие pdf которые составлены из отсканенных книжных страниц. Такие уж точно только FineReader"ом можно взять.
С другой стороны pdf можно напечатать в файл, а потом читать получившиеся графические файлы.


 
TUser ©   (2007-06-19 21:02) [5]

Вроде Adobe Acrobat умеет, начиная с шестой версии, или нет?


 
DillerXX ©   (2007-06-19 21:08) [6]


> Вроде Adobe Acrobat умеет, начиная с шестой версии, или
> нет?

Хм, возможно вы правы... У меня стоит Adobe Reader 7, и возможно это разные с акробатом вещи. Может скажите название дистрибутива для акробата (хоть 6го, если он умеет), скачаю его в локалке.


 
DrPass ©   (2007-06-19 21:10) [7]


> Бывают такие pdf которые составлены из отсканенных книжных
> страниц. Такие уж точно только FineReader"ом можно взять

Finereader любые PDF может взять, вообще-то

> TUser ©   (19.06.07 21:02) [5]
> Вроде Adobe Acrobat умеет, начиная с шестой версии, или
> нет?

Что умеет? Работать с PDF? Нет, еще не умеет. Обещают добавить в восьмой версии :)))


 
TUser ©   (2007-06-19 21:13) [8]

> Что умеет?

Экспортировать в rtf и html.


 
TUser ©   (2007-06-19 21:14) [9]

> Может скажите название дистрибутива для акробата

Adobe Acrobat, так и называется.

Ридер - это урезанная версия, токо читалка.


 
DillerXX ©   (2007-06-19 21:19) [10]

Хкм, кажется задача несколько сложнее. Кто-нибудь знает способ из формул внутри pdf"a сделать картинки (как это обычно делают во всяких документах), и сохранить в хтмл? Ведь хтмл сам по себе формулы поддерживать никак не сможет...


 
DrPass ©   (2007-06-19 21:19) [11]

Если серьезно, то Adobe Acrobat - неудобный инструмент для этого. Лучше всего взять FineReader. Он действительно перегонит PDF в DOC за пару нажатий клавиш с сохранением всего форматирования. Единственное что - это некоторое время займет, т.к. оно на самом деле сперва преобразовывает PDF в картинку, а потом распознает. Зато получается качественней, чем экспорт в Акробате


 
Anatoly Podgoretsky ©   (2007-06-19 21:40) [12]

> DrPass  (19.06.2007 21:19:11)  [11]

Насчет качества не сказал бы, только внешне.
А вот насчет doc так это они уже много лет дурят честной народ, на самом деле это не ворд документ, а переименованый rtf файл.


 
TUser ©   (2007-06-19 21:58) [13]

> DrPass ©   (19.06.07 21:19) [11]

Это шутка?


 
Vendict ©   (2007-06-19 22:02) [14]

есть ещё одна возможность.
если документ в нете есть и проиндексирован гуглом, то можно воспользоваться им. около каждого pdf-ки есть ссылка "в виде html".


 
palva ©   (2007-06-19 22:46) [15]

Тогда документ надо выложить в нет и дождаться, пока его проиндексируют.


 
DillerXX ©   (2007-06-19 23:11) [16]


> eсли документ в нете есть и проиндексирован гуглом, то можно
> воспользоваться им. около каждого pdf-ки есть ссылка "в
> виде html".

или мне кажется, или около документов на русском такой ссылки нет.


 
DrPass ©   (2007-06-20 00:52) [17]


> TUser ©   (19.06.07 21:58) [13]
> > DrPass ©   (19.06.07 21:19) [11]
>
> Это шутка?

Нет, суровая проза жизни


> Anatoly Podgoretsky ©   (19.06.07 21:40) [12]

Да как бы и не важно - расширение doc имеет, в ворде открывается и выглядит нормально... а чего уж там у него внутри, дык какая юзеру разница :)


 
Anatoly Podgoretsky ©   (2007-06-20 01:01) [18]

> DrPass  (20.06.2007 00:52:17)  [17]

Дык разное это и совсем не гарантируется открытия.
Но дело в том, что это недобросовестная реклама, лохотрон - продажа того чего нет.
С таким же успехом можно писать в txt и также переименовать расширение.


 
Petr V.Abramov   (2007-06-20 01:13) [19]

у pdf есть перимущество: математический текст с верхними-нижними индексами дродями-сигмами в три ряда в ворде точно поплывет, а pdf нормально держит


 
IMHO ©   (2007-06-20 01:27) [20]


> Anatoly Podgoretsky ©   (20.06.07 01:01) [18]
>
> > DrPass  (20.06.2007 00:52:17)  [17]
>
> Дык разное это и совсем не гарантируется открытия.
> Но дело в том, что это недобросовестная реклама, лохотрон
> - продажа того чего нет.
> С таким же успехом можно писать в txt и также переименовать
> расширение.


Толян, txt не содержит форматирования, а RTF содержит. Челу же нужно форматирование


> DillerXX ©   (19.06.07 20:31)
>
> Возможно ли сохранить pdf в html, doc, или иной формат,
> так чтобы было без потери всей информации? txt естественно
> не подходит...


 
DrPass ©   (2007-06-20 01:31) [21]


> Anatoly Podgoretsky ©   (20.06.07 01:01) [18]


> Но дело в том, что это недобросовестная реклама, лохотрон
> - продажа того чего нет.

Если что-то выглядит как утка, летает как утка и крякает как утка - я называю это уткой (с) английская пословица
Это же справедливо и для rtf. Данный формат стопроцентно поддерживается вордом и кроме того, переносим между его версиями.


 
Anatoly Podgoretsky ©   (2007-06-20 07:48) [22]

> IMHO  (20.06.2007 01:27:20)  [20]

Так я же не про форматирование, а про нечестную рекламу.
Поиграй в наперсток и поймешь, там вроде шарик тоже есть.


 
Gydvin ©   (2007-06-20 08:03) [23]

Дык вроде содержание разное, а значит "типа" все честно


 
oldman ©   (2007-06-20 10:53) [24]


> Petr V.Abramov   (20.06.07 01:13) [19]
> математический текст с верхними-
> нижними индексами дродями-сигмами в три ряда в ворде точно
> поплывет


У меня не плывет.
Я что-то неправильно делаю?


 
Petr V.Abramov   (2007-06-20 12:11) [25]

> oldman ©   (20.06.07 10:53) [24]
либо файл маленький, либо время не настало. еще в ворде в больших файлах таюлицы любят грохаться


 
Vendict ©   (2007-06-20 16:03) [26]

DrPass ©   (20.06.07 1:31) [21]
Это же справедливо и для rtf. Данный формат стопроцентно поддерживается вордом и кроме того, переносим между его версиями.


как-то я сохранил в rtf файлик в кодировке koi8r, так ворд всё равено его не понял.


 
IMHO ©   (2007-06-20 16:16) [27]

Как-то я открыл видеофильм и сохранил его как RTF. А Ворд его не понял! Какой глючный софт у Билли...


 
tesseract ©   (2007-06-20 16:58) [28]

недавно прислали, прямо в тему  : http://anub.ru/18.06.2007/u_sekretarshi_poehal_krishnyak/


 
Anatoly Podgoretsky ©   (2007-06-20 19:23) [29]

> Vendict  (20.06.2007 16:03:26)  [26]

Ни о каком переносе между версиями и речи нет, только снизу вверх, так с этим проблем и с вордом нет, до сих пор документы нормально переносятся из Word 6 (Win 3.1)


 
Mystic ©   (2007-06-20 23:19) [30]

Ради интереса поизвращался, набросал PDF, решил сконвертировать его в Acrobat 6.0 Pro в HTML (или DOC). И не конвертирует (шрифтов, говорит, много непонятных), и документ коцает.

http://mu.webest.net/demo.pdf



Страницы: 1 вся ветка

Текущий архив: 2007.07.22;
Скачать: CL | DM;

Наверх




Память: 0.54 MB
Время: 0.022 c
15-1182299605
multilink
2007-06-20 04:33
2007.07.22
Программа для управления несколькими соединениями


11-1165408011
Don
2006-12-06 15:26
2007.07.22
ошибка в WndProcGradientEx


2-1182969812
Тимофей
2007-06-27 22:43
2007.07.22
Вычислить


2-1182924390
_Asph
2007-06-27 10:06
2007.07.22
При перерисовке мелькает label


1-1179320420
Alexys
2007-05-16 17:00
2007.07.22
списки