Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2013.03.22;
Скачать: CL | DM;

Вниз

Tagged PDF   Найти похожие ветки 

 
GanibalLector ©   (2012-09-05 13:55) [0]

Есть PDF файлы, в свойствах которых Tagged PDF:No. Они, собственно, не конвертируются в txt для дальнейшей работы. Есть какой-то доступный способ включить у файла этот  Tagged PDF в Yes.

Спасибо.


 
AV ©   (2012-09-05 14:08) [1]

А если там нет текста, только картинки?
Посмотрите внутри тэги BeginT, EndT
есть м/д ними есть текст как текст, который на экране виден?


 
AV ©   (2012-09-05 14:23) [2]

как то писал конвертер чтобы PDF писать в БД как текст, иначе места не напасешься :)

Там все просто, Текст/ГдеXY/Шрифт (шрифт прилинкован может быть, вроде, не помню)/еще что

Берем текст, координаты знаем. Главная трудность была в координатах.
ГдеXY - положение по верт/гориз в пикселях - делим на Коэффициент(подбирал :)) без остатка и по полученному пишем по позициям
т.е. из X13/Y43 получаем X1/Y4, и, соответственно, пишем с первого символа четвертой строки
и т.п.



Страницы: 1 вся ветка

Текущий архив: 2013.03.22;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.082 c
15-1353960706
Дмитрий С
2012-11-27 00:11
2013.03.22
Удаленная отладка Lazarus


15-1352536128
alexdn
2012-11-10 12:28
2013.03.22
asp.net


15-1345139043
Pavia
2012-08-16 21:44
2013.03.22
Что прочнее?


2-1329076090
dis12345
2012-02-12 23:48
2013.03.22
checkbox в stringgrid


15-1354292775
Очень Злой
2012-11-30 20:26
2013.03.22
Оптимизировать код