Форум: "Прочее";
Текущий архив: 2013.03.22;
Скачать: [xml.tar.bz2];
ВнизTagged PDF Найти похожие ветки
← →
GanibalLector © (2012-09-05 13:55) [0]Есть PDF файлы, в свойствах которых Tagged PDF:No. Они, собственно, не конвертируются в txt для дальнейшей работы. Есть какой-то доступный способ включить у файла этот Tagged PDF в Yes.
Спасибо.
← →
AV © (2012-09-05 14:08) [1]А если там нет текста, только картинки?
Посмотрите внутри тэги BeginT, EndT
есть м/д ними есть текст как текст, который на экране виден?
← →
AV © (2012-09-05 14:23) [2]как то писал конвертер чтобы PDF писать в БД как текст, иначе места не напасешься :)
Там все просто, Текст/ГдеXY/Шрифт (шрифт прилинкован может быть, вроде, не помню)/еще что
Берем текст, координаты знаем. Главная трудность была в координатах.
ГдеXY - положение по верт/гориз в пикселях - делим на Коэффициент(подбирал :)) без остатка и по полученному пишем по позициям
т.е. из X13/Y43 получаем X1/Y4, и, соответственно, пишем с первого символа четвертой строки
и т.п.
Страницы: 1 вся ветка
Форум: "Прочее";
Текущий архив: 2013.03.22;
Скачать: [xml.tar.bz2];
Память: 0.44 MB
Время: 0.059 c