Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2013.03.22;
Скачать: CL | DM;

Вниз

Tagged PDF   Найти похожие ветки 

 
GanibalLector ©   (2012-09-05 13:55) [0]

Есть PDF файлы, в свойствах которых Tagged PDF:No. Они, собственно, не конвертируются в txt для дальнейшей работы. Есть какой-то доступный способ включить у файла этот  Tagged PDF в Yes.

Спасибо.


 
AV ©   (2012-09-05 14:08) [1]

А если там нет текста, только картинки?
Посмотрите внутри тэги BeginT, EndT
есть м/д ними есть текст как текст, который на экране виден?


 
AV ©   (2012-09-05 14:23) [2]

как то писал конвертер чтобы PDF писать в БД как текст, иначе места не напасешься :)

Там все просто, Текст/ГдеXY/Шрифт (шрифт прилинкован может быть, вроде, не помню)/еще что

Берем текст, координаты знаем. Главная трудность была в координатах.
ГдеXY - положение по верт/гориз в пикселях - делим на Коэффициент(подбирал :)) без остатка и по полученному пишем по позициям
т.е. из X13/Y43 получаем X1/Y4, и, соответственно, пишем с первого символа четвертой строки
и т.п.



Страницы: 1 вся ветка

Текущий архив: 2013.03.22;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.085 c
15-1339792202
Юрий
2012-06-16 00:30
2013.03.22
С днем рождения ! 16 июня 2012 суббота


15-1348084386
AV
2012-09-19 23:53
2013.03.22
Простой вопрос по TwebBrowser(я так думаю,что простой:)


15-1348522617
Inovet
2012-09-25 01:36
2013.03.22
Шнобелевская премия 2012


15-1351507682
ClawClaw
2012-10-29 14:48
2013.03.22
Мастерам раскрутки сайтов


1-1304803929
Германн
2011-05-08 01:32
2013.03.22
Сортировка в TTreeView