Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2013.03.22;
Скачать: CL | DM;

Вниз

Tagged PDF   Найти похожие ветки 

 
GanibalLector ©   (2012-09-05 13:55) [0]

Есть PDF файлы, в свойствах которых Tagged PDF:No. Они, собственно, не конвертируются в txt для дальнейшей работы. Есть какой-то доступный способ включить у файла этот  Tagged PDF в Yes.

Спасибо.


 
AV ©   (2012-09-05 14:08) [1]

А если там нет текста, только картинки?
Посмотрите внутри тэги BeginT, EndT
есть м/д ними есть текст как текст, который на экране виден?


 
AV ©   (2012-09-05 14:23) [2]

как то писал конвертер чтобы PDF писать в БД как текст, иначе места не напасешься :)

Там все просто, Текст/ГдеXY/Шрифт (шрифт прилинкован может быть, вроде, не помню)/еще что

Берем текст, координаты знаем. Главная трудность была в координатах.
ГдеXY - положение по верт/гориз в пикселях - делим на Коэффициент(подбирал :)) без остатка и по полученному пишем по позициям
т.е. из X13/Y43 получаем X1/Y4, и, соответственно, пишем с первого символа четвертой строки
и т.п.



Страницы: 1 вся ветка

Текущий архив: 2013.03.22;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.176 c
15-1338131036
ProgRAMmer Dimonych
2012-05-27 19:03
2013.03.22
HP Photosmart B110b и чёрный картридж


15-1340972066
Омлет
2012-06-29 16:14
2013.03.22
Почему в русском при отрицании [всё] = [ничего]?


2-1329302821
LDV
2012-02-15 14:47
2013.03.22
добавление/удаление в/из TList


15-1335682925
xayam
2012-04-29 11:02
2013.03.22
Не поверите !


15-1347866452
Scott Storch
2012-09-17 11:20
2013.03.22
AppStore