Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2003.09.01;
Скачать: CL | DM;

Вниз

Формат PDF   Найти похожие ветки 

 
keymaster ©   (2003-08-13 15:06) [0]

Надо делать анализ документа, представленного в pdf

Кто знает, как он устроен?


 
dataMaster ©   (2003-08-13 15:10) [1]

Картинка, кажется. Текст можно распознать и закинуть в Word из FineReader 6.


 
keymaster ©   (2003-08-13 15:15) [2]

задача в том, чтобы обойись без файнридера и ворда...

на входе - пдф, на выходе - результат...


 
Юрий Федоров ©   (2003-08-13 15:19) [3]

Насколько я помню, это закрытый формат


 
[lamer]Barmaglot ©   (2003-08-13 15:19) [4]

http://www.wotsit.org/download.asp?f=pdfspec


 
HolACost!   (2003-08-13 15:19) [5]

Только самому, но помоему всётаки как-то можно, но формат не открыт полностью... на сколько я знаю, что типа там чутьли не каждая строка - это объект, и с ним ведётся работа! Но впринципе картинка катринкой!


 
app ©   (2003-08-13 15:24) [6]

Юрий Федоров © (13.08.03 15:19) [3]
И они пришибают всех кто идет в обход Adobe Acrobat


 
Юрий Федоров ©   (2003-08-13 15:25) [7]

>>app © (13.08.03 15:24) [6]
Если документ сложный, там в обход Adobe Acrobat далеко не уйдешь


 
keymaster ©   (2003-08-13 15:25) [8]

> [lamer]Barmaglot ©
Спасибо, скачал, буду разбираться...


 
keymaster ©   (2003-08-13 15:26) [9]

Кому интересно, в документе таблица.


 
Danilka ©   (2003-08-13 15:39) [10]

keymaster ©
есть различные парсеры пдф, как платные так и бесплатные.
из бесплатных вот-эти вроде ничего:

http://www.foolabs.com/xpdf/
умеет вытаскивать текст из пдф-ок, правда не из всех, на некоторые ругается.

http://www.ghostscript.com
много чего умеет, но надо уметь писать команды на пост-скрипте.


 
HolACost!   (2003-08-13 15:50) [11]

Картинка это изображение вставленное в файл и переведенное в двочную систему хранения информации спомощью базового компилятора машинного языка с целью более удобного восприятия ее основным процессором копьютера.


 
HolACost!   (2003-08-13 16:03) [12]

Удалено модератором


 
HolACost! ©   (2003-08-13 16:05) [13]

Удалено модератором



Страницы: 1 вся ветка

Текущий архив: 2003.09.01;
Скачать: CL | DM;

Наверх




Память: 0.49 MB
Время: 0.033 c
1-1437
Vt
2003-08-19 04:20
2003.09.01
Какой ListView виден


1-1375
AlexLP
2003-08-16 18:17
2003.09.01
Копирование файлов с маской


11-1360
Vadim Petrov
2002-12-26 09:38
2003.09.01
Расскраска ListView


7-1678
Kirill_S
2003-06-18 12:38
2003.09.01
задержка выполнения Sleep()


14-1652
Mr&MsGuns
2003-08-12 16:12
2003.09.01
Моя старая ветка про библиотеки dll