Форум: "Прочее";
Текущий архив: 2011.12.11;
Скачать: [xml.tar.bz2];
ВнизРабота с TIFF. Найти похожие ветки
← →
TInd (2011-08-16 17:39) [0]Стоит задача обработки графических файлов (TIFF). Хотел поинтересоваться, кто какими пакетами/модулями/компонентами/библиотеками пользуется? Что лучше? Что хуже?
Если у вас есть наработки по работе с TIFF, то могу предложить разовую работу. Предложения сюда: tind@list.ru
← →
Dennis I. Komarov © (2011-08-16 17:57) [1]ТЗ и бюджет в студию, может и найдется желающий.
> то могу предложить разовую работу. Предложения сюда:...
Это от Вас предложения, вот и будьте любезны...
← →
Ega23 © (2011-08-16 19:31) [2]Ну я как-то лет 10 назад формат расковырял и картинки со сканера снимал.
А чо?
← →
Andy BitOff © (2011-08-16 19:41) [3]А я до сих пор с ним работаю.
← →
TInd (2011-08-16 20:15) [4]>ТЗ и бюджет в студию, может и найдется желающий.
Бюджет: от $750
ТЗ. Есть два листа А4 (в TIFF). На каждом листе по таблице на всю страницу. Задача: из двух листов сделать один лист. Таблицы сократить в столбцах.
Вот, если коротко.
← →
Jeer © (2011-08-17 10:24) [5]Ну и при чем тут TIFF ?
← →
TInd (2011-08-17 15:00) [6]При том, что файлы хранятся в формате TIFF.
← →
oldman © (2011-08-17 15:03) [7]
> файлы хранятся в формате TIFF
Значит нет там никаких таблиц. Столбцов, естественно тоже нет.
← →
TInd (2011-08-17 15:08) [8]2 oldman © (17.08.11 15:03) [7]
Ну, да. Там данные (нули и единицы). Это что-то меняет?
А если инвариантно репрезентовать эти нули и единицы, то получатся таблицы (и столбцы, естественно).
← →
oldman © (2011-08-17 15:10) [9]
> TInd (17.08.11 15:08) [8]
Не проще нарезать на куски и склеить?
Это же графический формат.
← →
TInd (2011-08-17 15:15) [10]2 oldman © (17.08.11 15:10) [9]
Не совсем понял. Это вы так иронизируете? Или речь идет о программном "нарезании".
← →
oldman © (2011-08-17 15:16) [11]
> Или речь идет о программном "нарезании"
Канэчна!!!
← →
Ega23 © (2011-08-17 15:17) [12]
> А если инвариантно репрезентовать эти нули и единицы, то
> получатся таблицы (и столбцы, естественно).
А при чём тут TIFF?
← →
Jeer © (2011-08-17 15:30) [13]
> TInd (17.08.11 15:00) [6]
>
> При том, что файлы хранятся в формате TIFF.
Да хоть в каком ином графическом формате - это ничего не меняет для основной задачи Вашего ТЗ - распознавание образов. Ферштейн ?
← →
TInd (2011-08-17 15:30) [14]2 oldman © (17.08.11 15:16) [11]
Я далек от работы с графикой. Вот поэтому и прошу инструменты (модули и компоненты) и знания (книги). Или, если найдется желающий, то готов оплатить его труды.
2 Ega23 © (17.08.11 15:17) [12]
Хорошо, как по вашему я должен был поставить свой вопрос?
← →
TInd (2011-08-17 15:34) [15]2 Jeer © (17.08.11 15:30) [13]
>Ферштейн ?
Да.
P.S> Насколько я знаю, Delphi не может работать с форматом файлов TIFF. Потребуются какие-то дополнительные инструменты.
← →
Jeer © (2011-08-17 15:39) [16]
> Хорошо, как по вашему я должен был поставить свой вопрос?
Имеются файлы изображений в одном из известных графических форматов, в частности TIFF.
На файлах изображены ( результат экспорта из некоторого софта ) двумерные таблицы однородной структуры с высокой степенью ее повторяемости и числовыми данными в ячейках.
Имеются парные файлы и задача состоит в "склейке" пар файлов в один, того же TIFF-формата.
Дополнительно необходимо удаление некоторых столбцов таблиц.
...
Особенности вырезания столбцов состоят в...
Примеры файлов выложены на http://***
← →
Jeer © (2011-08-17 15:41) [17]
> P.S> Насколько я знаю, Delphi не может работать с форматом
> файлов TIFF.
Delphi - самодостаточный ЯВУ. Все, что не включено в базовые возможности - дописывается и это правильно.
← →
Dennis I. Komarov © (2011-08-17 15:48) [18]
> Дополнительно необходимо удаление некоторых столбцов таблиц.
Вот тут бюджет треснет...
← →
Jeer © (2011-08-17 15:49) [19]
> Dennis I. Komarov © (17.08.11 15:48) [18]
> Вот тут бюджет треснет...
Не факт. Если это не сканированная рухлядь, а экспорт из софта по жесткой структуре - проще простого вырезать полосу. В это случае - работа на день.
← →
sniknik © (2011-08-17 16:13) [20]> а экспорт из софта по жесткой структуре - проще простого вырезать полосу. В это случае - работа на день.
а почитать мануал софта, и найти там к примеру альтернативную выгрузку в csv например... и вообще без денег останешься.
← →
Jeer © (2011-08-17 16:15) [21]
> и вообще без денег останешься.
Ну вот, пришел сникник и обломал "развод" на 20 тыщ :)
← →
Ega23 © (2011-08-17 16:25) [22]
> проще простого вырезать полосу.
Да ладно? Не, конечно, если таблица жёстко структурирована по длине столбцов в пикселях, то да, вроде сложностей нет.
Иначе - пичалько.
← →
Jeer © (2011-08-17 16:43) [23]
> какими пакетами/модулями/компонентами
TWICImage ( Delphi 2010 )
LibTiff ( D6 и выше )
← →
TInd (2011-08-17 16:45) [24]2 Jeer © (17.08.11 15:49) [19]
>Если это не сканированная рухлядь, а экспорт из софта по жесткой структуре - проще простого вырезать полосу.
Вообще-то это сканированная рухлядь. Выглядит нормально, кстати. 300dpi. Есть примеры файлов. Так что, есть желающие?
Кстати, софт, который ПОТОМ работает с этим изображением запросто "нарезает" ячейки таблиц.
← →
Jeer © (2011-08-17 16:45) [25]
> Иначе - пичалько.
Да ладно - обойти периметры таблицы и ячеек по контуру ноу проблем.
← →
Jeer © (2011-08-17 16:47) [26]
> Есть примеры файлов
Ну и выложи - это же не архив сру или гб, надеемся :)
← →
TInd (2011-08-17 16:51) [27]Вот: http://zalil.ru/31567865
Могу еще. Их тут тыщ 50.
← →
Jeer © (2011-08-17 16:57) [28]Ну да, качество вполне.
Теперь осталось добавить к задаче: изменение в нужных ячейках столбца "Кол-во" и простановка столбца "Сумма" тоже прописью :)
← →
Dennis I. Komarov © (2011-08-17 17:06) [29]Вот до чего доводит отсутствие backup копии :)
← →
TInd (2011-08-17 17:09) [30]Всё проще. Удалить столбцы "Название" и "Цена" (возможно и "Сумма").
И еще. Перед удалением столбцов, необходимо выполнить алгоритм Deskew. Это ж "сканированная рухлядь", поэтому иногда изображения бывают под разными углами.
Всё.
← →
Jeer © (2011-08-17 17:19) [31]Что есть "удаление столбцов" ?
Уменьшение числа столбцов в таблице или очистка значений в ячейках необходимых столбцов ?
← →
TInd (2011-08-17 17:29) [32]Уменьшение числа столбцов до 2(3).
← →
Jeer © (2011-08-17 17:49) [33]Могут быть проблемы с этим - если подписи налезают на таблицу.
Впрочем, ладно - работа не сложная, я бы даже взялся за пару-тройку дней.
Но я "химией" не занимаюсь принципиально.
← →
TInd (2011-08-17 17:56) [34]Не совсем понял, где вы нашли "химию"?
Хорошо, мы можем наш диалог продолжить в привате? Ваша почта в анкете актуальна?
← →
Jeer © (2011-08-17 18:03) [35]Да, вполне актуальна.
"Химия" - в изменении свойств итогового документа.
Тот, кто подписывал, видел одно, а Вы предлагаете ему "подписаться" под другим.
А ТЗ должно было выглядить таким:
- выделить персонифицированные данные ( подписи и рукопись );
- сформировать новую таблицу с желаемыми строками и столбцами, наложив персонифицированные данные.
Тут, все ясно и понятно - до УК рукой подать.
← →
TInd (2011-08-17 18:54) [36]Вы не правы. В новом документе мне НЕ НУЖНА подпись вообще. При чем здесь УК? И делается это совсем для иных целей.
← →
Jeer © (2011-08-18 09:33) [37]
> В новом документе мне НЕ НУЖНА подпись вообще.
Значит Ваше ТЗ было так изложено, что можно было понять так, как понял я.
> НЕ НУЖНА подпись вообще.
Этого уточнения в ТЗ не было.
← →
самый умный (2011-08-19 07:12) [38]пойщите прогу для пакетного конвертирования tiff в bmp и настанет вам щастие. Сможете в Делфи попрогать самостоятельно
← →
Ega23 © (2011-08-19 08:59) [39]
> пакетного конвертирования tiff в bmp
Сконвертировать tiff в bmp - дело на полчаса, никаких сложностей в этом нет.
← →
Anatoly Podgoretsky © (2011-08-19 09:06) [40]> самый умный (19.08.2011 07:12:38) [38]
в ifran есть пакетная обработка. Да и вообще так программ множество.
← →
Anatoly Podgoretsky © (2011-08-19 09:07) [41]> самый умный (19.08.2011 07:12:38) [38]
Например элементарнейший bat файл, даже не powerShell, оператор FOR
← →
QAZ (2011-08-19 10:45) [42]а разве тут не нужно распознование ручного текста из "кол-во" с сумированием ?
← →
Омлет © (2011-08-19 10:58) [43]Как раз для такой задачи: http://habrahabr.ru/company/abbyy/blog/125347/
← →
Andy BitOff © (2011-08-19 10:59) [44]
> QAZ (19.08.11 10:45) [42]
> а разве тут не нужно распознование ручного текста из "кол-
> во" с сумированием ?
Теоретически нет. Т.к. изображения формализованы (т.е. фактически одинаковые), можно начиная с определенной точки на изображении начать поиск приметных мест. А уж алгоритм распознавания этих мест - любой, я бы, наверное, взял бы эталоны.
← →
Jeer © (2011-08-19 12:34) [45]
> А уж алгоритм распознавания этих мест
У аффтара вообще задача весьма странная, фактически нужно оставить столбцы "кол-во" и "№".
По сути все сводится к распознаванию размеров таблицы, выцыплением нужных стобцов, рисованием новой и наложением нужных столбцов.
Тем более, там еще и склейка у него с другой таблицей.
← →
TInd (2011-08-19 13:28) [46]2 Jeer © (19.08.11 12:34) [45]
>Тем более, там еще и склейка у него с другой таблицей.
Склеивать не надо. На листе должно появится две таблицы.
Так вы беретесь или нет?
← →
Jeer © (2011-08-19 15:24) [47]
> Так вы беретесь или нет?
Изложите более детально ТЗ, т.к. все равно муть осталась.
Скиньте на algcom mail ru с примерами исходных двух файлов и результата ( можно в Фотошопе пример склеить ).
Желательно выложить с десяток другой пар исходных таблиц для тестирования.
Если точно пойму, что Вам надо - почему бы и не взяться.
← →
самый умный (2011-08-20 12:33) [48]
> У аффтара вообще задача весьма странная
и практически не подъемная. Ибо:
> Вообще-то это сканированная рухлядь.
....................
> Это ж "сканированная рухлядь", поэтому иногда изображения
> бывают под разными углами.
а также "мусор" при скане и подобные "прелести"
← →
Jeer © (2011-08-25 16:39) [49]Итог:
История закончилась тем, чем и ожидалась.
Невнятное и так не сформулированное ТЗ, новые вводные по произвольной форме таблиц-изображений (класс !), требование исходников и ни слова об увеличении бюджета..:)
Такое впечатление, что разработчик, которому повесили в его фирме эту задачу, с ней не справился и решил пошукать, кто за него ее выполнит.
Детсад.
← →
самый умный (2011-08-25 16:53) [50]
> Jeer © (25.08.11 16:39) [49]
Пятерка секретарш справится лучше
← →
TInd (2011-08-26 01:18) [51]2 Jeer © (25.08.11 16:39) [49]
Спорно. Я не стесняюсь весь диалог (или его части) разместить здесь. Это вы чего-то испугались.
← →
Германн © (2011-08-26 01:23) [52]
> Я не стесняюсь весь диалог (или его части) разместить здесь.
Так размести. Мне тоже интересно.
← →
TInd (2011-08-26 01:45) [53]2 Германн © (26.08.11 01:23) [52]
Без проблем, но, согласитесь, без одобрения Jeer этого делать не стоит. Это будет не совсем толерантно.
Причина конфликта: исходники. Я настаиваю на том, что мне нужна гибкость. В случаи изменения формата листа мне необходимо будет бесконечно обращаться к автору, что не входит в мои планы. Предложение скрыть важные части кода в DLL он игнорирует. Примерно так.
← →
Омлет © (2011-08-26 08:44) [54]За исходники всегда цена на порядок выше.
← →
Jeer © (2011-08-26 10:03) [55]
> Причина конфликта:
Конфликта не было, с чего бы ?
Мы не договорились по причинам:
1. Значительное изменение вводных ( работа с произвольными таблицами );
Это потребует разработки визуального дизайнера правил разбора произвольных таблиц и последующей автоматической классификации входных таблиц для выбора соответствующих правил. Бюджет в 20 тыщ.рублей тут не просто трещит, а давно уже взорвался.
2. Требование исходников. Запихивать визуальные компоненты в DLL, перелопачивать свои библиотеки и погружать их тоже в DLL ?
Зачем мне это ? Ну сделаю, что в итоге останется в main ? Библиотечные вызовы и события по жамканью кнопок ? Заказчик сам все равно ничего сделать в дальнейшем не сможет.
Оставлять снаружи модули распознавания ? Так это самое вкусное.
3.Заказчик боится, что я исчезну, что буду требовать на каждый чих доп.оплаты.
Я всегда тут. Не болею, в принципе. Голова пока работает :)
Недовольных Заказчиков не было, потому, что я не связываюсь с проблемными заказами.
Есть проекты, которые я веду около 10 лет и, по мере необходимости, бывают доработки, имеющие разумную для обеих сторон цену.
Как раз один из проектов для Санэпидемнадзора включал модуль распознавания таблиц и выцарапывания циферек. Да, пару раз менялась форма таблиц. Проще доплатить за доработку, чем закладывать универсальный механизм, который все равно не сделать.
4. Как верно замечено, исходники стоят на порядок дороже. Но дело в том, что математика обработки изображений включает большое число взаимосвязанных моих библиотек и отдавать их я точно не собираюсь.
Все это было изложено потенциальному Заказчику.
Особенность его реакции в том, что это не конечный Заказчик, а софтверная фирма - разработчик основного заказа. Я так понял.
В общем, у меня за многие годы "одиночного плавания" выработались устойчивые правила, которые не нарушаю:
- работаю, чаще для интереса, чем за большие деньги;
- предпочитаю создавать не типовые и не универсальные продукты - это проще, интереснее для меня и дешевле для Заказчика;
- исходники не предоставляю, поскольку работаю на конечную цель и готовый продукт;
- любой проект рано или поздно умирает, поэтому период сопровождения и стомость владения продуктом имеют разумные пределы ;
← →
Anatoly Podgoretsky © (2011-08-26 10:04) [56]> TInd (26.08.2011 01:45:53) [53]
Ну так и не требуй этого с Jeer
А то с угроз начал, мол испугались.
← →
TInd (2011-08-26 11:24) [57]Удалено модератором
Примечание: Разборки в личную почту
← →
Jeer © (2011-08-26 11:30) [58]
> Кто платит, тот и музыку заказывает.
Если находит музыкантов, то и слушает.
А может и не найти.
Тогда придется играть самому для себя - при отсутствии слуха это не страшно.
За сим откланиваюсь.
← →
Омлет © (2011-08-26 11:36) [59]Вот и поработали с TIFF..
← →
TInd (2011-08-26 11:40) [60]2 Омлет © (26.08.11 11:36) [59]
>Вот и поработали с TIFF..
Ой, не говори )))
← →
TInd (2011-08-26 11:46) [61]2 Jeer © (26.08.11 11:30) [58]
>Тогда придется играть самому для себя - при отсутствии слуха это не страшно.
Книги уже заказал. Буду пытаться "играть" для себя.
P.S. От "музыканта" я по-прежнему не отказывась. Ищу нового )))
← →
Jeer © (2011-08-26 11:50) [62]
> От "музыканта" я по-прежнему не отказывась. Ищу нового )))
Без обид.
С идейными вопросами можете продолжать сюда заходить :)
Или в личку на почту.
Страницы: 1 2 вся ветка
Форум: "Прочее";
Текущий архив: 2011.12.11;
Скачать: [xml.tar.bz2];
Память: 0.61 MB
Время: 0.006 c