Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2013.03.22;
Скачать: CL | DM;

Вниз

Tagged PDF   Найти похожие ветки 

 
GanibalLector ©   (2012-09-05 13:55) [0]

Есть PDF файлы, в свойствах которых Tagged PDF:No. Они, собственно, не конвертируются в txt для дальнейшей работы. Есть какой-то доступный способ включить у файла этот  Tagged PDF в Yes.

Спасибо.


 
AV ©   (2012-09-05 14:08) [1]

А если там нет текста, только картинки?
Посмотрите внутри тэги BeginT, EndT
есть м/д ними есть текст как текст, который на экране виден?


 
AV ©   (2012-09-05 14:23) [2]

как то писал конвертер чтобы PDF писать в БД как текст, иначе места не напасешься :)

Там все просто, Текст/ГдеXY/Шрифт (шрифт прилинкован может быть, вроде, не помню)/еще что

Берем текст, координаты знаем. Главная трудность была в координатах.
ГдеXY - положение по верт/гориз в пикселях - делим на Коэффициент(подбирал :)) без остатка и по полученному пишем по позициям
т.е. из X13/Y43 получаем X1/Y4, и, соответственно, пишем с первого символа четвертой строки
и т.п.



Страницы: 1 вся ветка

Текущий архив: 2013.03.22;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.099 c
15-1344630602
Юрий
2012-08-11 00:30
2013.03.22
С днем рождения ! 11 августа 2012 суббота


15-1345910897
Чтец
2012-08-25 20:08
2013.03.22
Ищу книгу


15-1344450199
ppoko
2012-08-08 22:23
2013.03.22
w8


2-1331014601
DevilDevil
2012-03-06 10:16
2013.03.22
Помогите то ли с куки, то ли с переадресацией


1-1275549451
ford
2010-06-03 11:17
2013.03.22
чтение текстовых данных из двоичных файлов (PDF)