Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Потрепаться";
Текущий архив: 2003.09.01;
Скачать: [xml.tar.bz2];

Вниз

Формат PDF   Найти похожие ветки 

 
keymaster   (2003-08-13 15:06) [0]

Надо делать анализ документа, представленного в pdf

Кто знает, как он устроен?


 
dataMaster   (2003-08-13 15:10) [1]

Картинка, кажется. Текст можно распознать и закинуть в Word из FineReader 6.


 
keymaster   (2003-08-13 15:15) [2]

задача в том, чтобы обойись без файнридера и ворда...

на входе - пдф, на выходе - результат...


 
Юрий Федоров   (2003-08-13 15:19) [3]

Насколько я помню, это закрытый формат


 
[lamer]Barmaglot   (2003-08-13 15:19) [4]

http://www.wotsit.org/download.asp?f=pdfspec


 
HolACost!   (2003-08-13 15:19) [5]

Только самому, но помоему всётаки как-то можно, но формат не открыт полностью... на сколько я знаю, что типа там чутьли не каждая строка - это объект, и с ним ведётся работа! Но впринципе картинка катринкой!


 
app   (2003-08-13 15:24) [6]

Юрий Федоров © (13.08.03 15:19) [3]
И они пришибают всех кто идет в обход Adobe Acrobat


 
Юрий Федоров   (2003-08-13 15:25) [7]

>>app © (13.08.03 15:24) [6]
Если документ сложный, там в обход Adobe Acrobat далеко не уйдешь


 
keymaster   (2003-08-13 15:25) [8]

> [lamer]Barmaglot ©
Спасибо, скачал, буду разбираться...


 
keymaster   (2003-08-13 15:26) [9]

Кому интересно, в документе таблица.


 
Danilka   (2003-08-13 15:39) [10]

keymaster ©
есть различные парсеры пдф, как платные так и бесплатные.
из бесплатных вот-эти вроде ничего:

http://www.foolabs.com/xpdf/
умеет вытаскивать текст из пдф-ок, правда не из всех, на некоторые ругается.

http://www.ghostscript.com
много чего умеет, но надо уметь писать команды на пост-скрипте.


 
HolACost!   (2003-08-13 15:50) [11]

Картинка это изображение вставленное в файл и переведенное в двочную систему хранения информации спомощью базового компилятора машинного языка с целью более удобного восприятия ее основным процессором копьютера.


 
HolACost!   (2003-08-13 16:03) [12]

Удалено модератором


 
HolACost!   (2003-08-13 16:05) [13]

Удалено модератором



Страницы: 1 вся ветка

Форум: "Потрепаться";
Текущий архив: 2003.09.01;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.46 MB
Время: 0.009 c
14-1632
Zergling
2003-08-13 11:38
2003.09.01
А где орешник?


1-1417
DelphiNew
2003-08-19 15:51
2003.09.01
Печать


8-1511
Литвиненко Вадим
2003-04-28 15:28
2003.09.01
Image+Label = сохранение картинки


1-1432
opoloXAI
2003-08-18 10:10
2003.09.01
RichEdit.Lines.Count > 460


1-1373
Question
2003-08-16 18:03
2003.09.01
Указателю на динамический массив значения после GetMem





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский