Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Прочее";
Текущий архив: 2013.03.22;
Скачать: [xml.tar.bz2];

Вниз

Tagged PDF   Найти похожие ветки 

 
GanibalLector ©   (2012-09-05 13:55) [0]

Есть PDF файлы, в свойствах которых Tagged PDF:No. Они, собственно, не конвертируются в txt для дальнейшей работы. Есть какой-то доступный способ включить у файла этот  Tagged PDF в Yes.

Спасибо.


 
AV ©   (2012-09-05 14:08) [1]

А если там нет текста, только картинки?
Посмотрите внутри тэги BeginT, EndT
есть м/д ними есть текст как текст, который на экране виден?


 
AV ©   (2012-09-05 14:23) [2]

как то писал конвертер чтобы PDF писать в БД как текст, иначе места не напасешься :)

Там все просто, Текст/ГдеXY/Шрифт (шрифт прилинкован может быть, вроде, не помню)/еще что

Берем текст, координаты знаем. Главная трудность была в координатах.
ГдеXY - положение по верт/гориз в пикселях - делим на Коэффициент(подбирал :)) без остатка и по полученному пишем по позициям
т.е. из X13/Y43 получаем X1/Y4, и, соответственно, пишем с первого символа четвертой строки
и т.п.



Страницы: 1 вся ветка

Форум: "Прочее";
Текущий архив: 2013.03.22;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.44 MB
Время: 0.09 c
2-1337367250
TStas
2012-05-18 22:54
2013.03.22
Перехвать изменений текста в ричЭдите


2-1331575099
Дмитрий
2012-03-12 21:58
2013.03.22
Проблема к кеширующим прокси на основе IndyHttpProxyServer


6-1265664456
olevacho
2010-02-09 00:27
2013.03.22
выполнение route из под ограниченого пользователя


15-1349167256
AV
2012-10-02 12:40
2013.03.22
Теоретически можно брать байты из файла и выполнять как код?


2-1332500814
alex810810
2012-03-23 15:06
2013.03.22
Передача параметра со значение NULL





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский