Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Прочее";
Текущий архив: 2007.07.22;
Скачать: [xml.tar.bz2];

Вниз

Из pdf а html   Найти похожие ветки 

 
DillerXX ©   (2007-06-19 20:31) [0]

Возможно ли сохранить pdf в html, doc, или иной формат, так чтобы было без потери всей информации? txt естественно не подходит...


 
Vendict ©   (2007-06-19 20:35) [1]

DillerXX ©   (19.06.07 20:31)
зачем ? pdf же платформонезависимый формат, везде будет читаться.


 
DillerXX ©   (2007-06-19 20:37) [2]

Не нашёл ридера для Sony Ericсson k750, поэтому решил разбить на несколько хтмл страниц, возможно с картинками.


 
Anatoly Podgoretsky ©   (2007-06-19 20:40) [3]

> Vendict  (19.06.2007 20:35:01)  [1]

Это только слова


 
palva ©   (2007-06-19 20:58) [4]

Бывают такие pdf которые составлены из отсканенных книжных страниц. Такие уж точно только FineReader"ом можно взять.
С другой стороны pdf можно напечатать в файл, а потом читать получившиеся графические файлы.


 
TUser ©   (2007-06-19 21:02) [5]

Вроде Adobe Acrobat умеет, начиная с шестой версии, или нет?


 
DillerXX ©   (2007-06-19 21:08) [6]


> Вроде Adobe Acrobat умеет, начиная с шестой версии, или
> нет?

Хм, возможно вы правы... У меня стоит Adobe Reader 7, и возможно это разные с акробатом вещи. Может скажите название дистрибутива для акробата (хоть 6го, если он умеет), скачаю его в локалке.


 
DrPass ©   (2007-06-19 21:10) [7]


> Бывают такие pdf которые составлены из отсканенных книжных
> страниц. Такие уж точно только FineReader"ом можно взять

Finereader любые PDF может взять, вообще-то

> TUser ©   (19.06.07 21:02) [5]
> Вроде Adobe Acrobat умеет, начиная с шестой версии, или
> нет?

Что умеет? Работать с PDF? Нет, еще не умеет. Обещают добавить в восьмой версии :)))


 
TUser ©   (2007-06-19 21:13) [8]

> Что умеет?

Экспортировать в rtf и html.


 
TUser ©   (2007-06-19 21:14) [9]

> Может скажите название дистрибутива для акробата

Adobe Acrobat, так и называется.

Ридер - это урезанная версия, токо читалка.


 
DillerXX ©   (2007-06-19 21:19) [10]

Хкм, кажется задача несколько сложнее. Кто-нибудь знает способ из формул внутри pdf"a сделать картинки (как это обычно делают во всяких документах), и сохранить в хтмл? Ведь хтмл сам по себе формулы поддерживать никак не сможет...


 
DrPass ©   (2007-06-19 21:19) [11]

Если серьезно, то Adobe Acrobat - неудобный инструмент для этого. Лучше всего взять FineReader. Он действительно перегонит PDF в DOC за пару нажатий клавиш с сохранением всего форматирования. Единственное что - это некоторое время займет, т.к. оно на самом деле сперва преобразовывает PDF в картинку, а потом распознает. Зато получается качественней, чем экспорт в Акробате


 
Anatoly Podgoretsky ©   (2007-06-19 21:40) [12]

> DrPass  (19.06.2007 21:19:11)  [11]

Насчет качества не сказал бы, только внешне.
А вот насчет doc так это они уже много лет дурят честной народ, на самом деле это не ворд документ, а переименованый rtf файл.


 
TUser ©   (2007-06-19 21:58) [13]

> DrPass ©   (19.06.07 21:19) [11]

Это шутка?


 
Vendict ©   (2007-06-19 22:02) [14]

есть ещё одна возможность.
если документ в нете есть и проиндексирован гуглом, то можно воспользоваться им. около каждого pdf-ки есть ссылка "в виде html".


 
palva ©   (2007-06-19 22:46) [15]

Тогда документ надо выложить в нет и дождаться, пока его проиндексируют.


 
DillerXX ©   (2007-06-19 23:11) [16]


> eсли документ в нете есть и проиндексирован гуглом, то можно
> воспользоваться им. около каждого pdf-ки есть ссылка "в
> виде html".

или мне кажется, или около документов на русском такой ссылки нет.


 
DrPass ©   (2007-06-20 00:52) [17]


> TUser ©   (19.06.07 21:58) [13]
> > DrPass ©   (19.06.07 21:19) [11]
>
> Это шутка?

Нет, суровая проза жизни


> Anatoly Podgoretsky ©   (19.06.07 21:40) [12]

Да как бы и не важно - расширение doc имеет, в ворде открывается и выглядит нормально... а чего уж там у него внутри, дык какая юзеру разница :)


 
Anatoly Podgoretsky ©   (2007-06-20 01:01) [18]

> DrPass  (20.06.2007 00:52:17)  [17]

Дык разное это и совсем не гарантируется открытия.
Но дело в том, что это недобросовестная реклама, лохотрон - продажа того чего нет.
С таким же успехом можно писать в txt и также переименовать расширение.


 
Petr V.Abramov   (2007-06-20 01:13) [19]

у pdf есть перимущество: математический текст с верхними-нижними индексами дродями-сигмами в три ряда в ворде точно поплывет, а pdf нормально держит


 
IMHO ©   (2007-06-20 01:27) [20]


> Anatoly Podgoretsky ©   (20.06.07 01:01) [18]
>
> > DrPass  (20.06.2007 00:52:17)  [17]
>
> Дык разное это и совсем не гарантируется открытия.
> Но дело в том, что это недобросовестная реклама, лохотрон
> - продажа того чего нет.
> С таким же успехом можно писать в txt и также переименовать
> расширение.


Толян, txt не содержит форматирования, а RTF содержит. Челу же нужно форматирование


> DillerXX ©   (19.06.07 20:31)
>
> Возможно ли сохранить pdf в html, doc, или иной формат,
> так чтобы было без потери всей информации? txt естественно
> не подходит...


 
DrPass ©   (2007-06-20 01:31) [21]


> Anatoly Podgoretsky ©   (20.06.07 01:01) [18]


> Но дело в том, что это недобросовестная реклама, лохотрон
> - продажа того чего нет.

Если что-то выглядит как утка, летает как утка и крякает как утка - я называю это уткой (с) английская пословица
Это же справедливо и для rtf. Данный формат стопроцентно поддерживается вордом и кроме того, переносим между его версиями.


 
Anatoly Podgoretsky ©   (2007-06-20 07:48) [22]

> IMHO  (20.06.2007 01:27:20)  [20]

Так я же не про форматирование, а про нечестную рекламу.
Поиграй в наперсток и поймешь, там вроде шарик тоже есть.


 
Gydvin ©   (2007-06-20 08:03) [23]

Дык вроде содержание разное, а значит "типа" все честно


 
oldman ©   (2007-06-20 10:53) [24]


> Petr V.Abramov   (20.06.07 01:13) [19]
> математический текст с верхними-
> нижними индексами дродями-сигмами в три ряда в ворде точно
> поплывет


У меня не плывет.
Я что-то неправильно делаю?


 
Petr V.Abramov   (2007-06-20 12:11) [25]

> oldman ©   (20.06.07 10:53) [24]
либо файл маленький, либо время не настало. еще в ворде в больших файлах таюлицы любят грохаться


 
Vendict ©   (2007-06-20 16:03) [26]

DrPass ©   (20.06.07 1:31) [21]
Это же справедливо и для rtf. Данный формат стопроцентно поддерживается вордом и кроме того, переносим между его версиями.


как-то я сохранил в rtf файлик в кодировке koi8r, так ворд всё равено его не понял.


 
IMHO ©   (2007-06-20 16:16) [27]

Как-то я открыл видеофильм и сохранил его как RTF. А Ворд его не понял! Какой глючный софт у Билли...


 
tesseract ©   (2007-06-20 16:58) [28]

недавно прислали, прямо в тему  : http://anub.ru/18.06.2007/u_sekretarshi_poehal_krishnyak/


 
Anatoly Podgoretsky ©   (2007-06-20 19:23) [29]

> Vendict  (20.06.2007 16:03:26)  [26]

Ни о каком переносе между версиями и речи нет, только снизу вверх, так с этим проблем и с вордом нет, до сих пор документы нормально переносятся из Word 6 (Win 3.1)


 
Mystic ©   (2007-06-20 23:19) [30]

Ради интереса поизвращался, набросал PDF, решил сконвертировать его в Acrobat 6.0 Pro в HTML (или DOC). И не конвертирует (шрифтов, говорит, много непонятных), и документ коцает.

http://mu.webest.net/demo.pdf



Страницы: 1 вся ветка

Форум: "Прочее";
Текущий архив: 2007.07.22;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.52 MB
Время: 0.052 c
2-1182477171
wesel
2007-06-22 05:52
2007.07.22
MDI приложения, переход по открытым окнам как по TASKBAR


1-1179386675
ewer
2007-05-17 11:24
2007.07.22
Вызов скрипта на Matlab е из программы на Delphi


2-1182845815
Dimon777
2007-06-26 12:16
2007.07.22
Как узнать имя пользователя, запустившего приложение?


2-1182878717
T.V
2007-06-26 21:25
2007.07.22
Вопрос по ф-ции GetProcessImageFileName


2-1182614540
cossak
2007-06-23 20:02
2007.07.22
переменная баг d7?





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский