Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2013.03.22;
Скачать: CL | DM;

Вниз

Сортировка изображений по "содержимому"   Найти похожие ветки 

 
Цукор5   (2012-04-28 13:22) [0]

Есть несколько тысяч файлов (TIF), полученных в результате сканирования. Иногда, случайным образом сканируются листы не по шаблону. Задача: создать приложение, которое бы проверяло, соответствует ли файл шаблону.

Готовое решение мне не нужно. Я лишь интересуюсь возможными вариантами решения, чтобы выбрать оптимальное и правильное. Очень важно получить совет о нужное книге, если действительно есть что посоветовать.

Пока вижу такие варианты:
- задействовать нейронную сеть (никогда не работал с нею).
- вырезать часть изображения  и искать на любом файле совпадения.

Спасибо.


 
Цукор5   (2012-04-28 13:24) [1]

Ссылки на изображения дать не могу — форум удаляет посты с ссылками. Уж не знаю почему.


 
Думкин ©   (2012-04-28 13:48) [2]


> форум удаляет посты с ссылками. Уж не знаю почему.

http://delphimaster.ru/cgi-bin/forum.pl?n=3


 
Rouse_ ©   (2012-04-28 13:51) [3]


> Цукор5   (28.04.12 13:24) [1]
> Ссылки на изображения дать не могу — форум удаляет посты
> с ссылками. Уж не знаю почему.

больше 4 ссылок в сообщении считается спамом и трется автоматически...


 
sniknik ©   (2012-04-28 14:02) [4]

http://delphimaster.net/view/15-1335604943/
http://delphimaster.net/view/15-1335604943/
http://delphimaster.net/view/15-1335604943/
http://delphimaster.net/view/15-1335604943/
http://delphimaster.net/view/15-1335604943/


 
БарЛог ©   (2012-04-28 14:17) [5]

А я побоялся проверять :)


 
Цукор5   (2012-04-28 16:23) [6]

Господа, а по теме?


 
han_malign   (2012-04-28 16:35) [7]


> форум удаляет посты с ссылками. Уж не знаю почему.

> sniknik ©


 
CRLF   (2012-04-28 16:36) [8]


> Готовое решение мне не нужно.
То есть принципиально нужно сделать самому? Или "не подумайте, что я хочу исходники выпросить"?


 
MBo ©   (2012-04-28 16:47) [9]

Стоило бы посмотреть образцы по шаблону и не по шаблону - пару ссылок-то форум должен пропустить.
Возможно, простым способом будет применение OpenCV. Протестировать подходы можно и в Matlab


 
Цукор5   (2012-04-28 17:23) [10]

По шаблону: http://gyazo.com/9310816212b19de18b0dff2102351256


 
Цукор5   (2012-04-28 17:24) [11]

Не по шаблону:
http://gyazo.com/fd0b9ee3d583b0c21fb89b73ac071fcb
http://gyazo.com/fff7cd2c26ba9cbf7e7488d0810615c7


 
MBo ©   (2012-04-28 17:53) [12]

Картинка по шаблону не отображается. А не по шаблону - видно.


 
Наиль ©   (2012-04-28 20:27) [13]

Для отсеивания очевидных косяков можно использовать миниатюры.
Показывать по 50 шт на экране.
Для тысячи штук это будет 20 экранов.
Человек может выкинуть всё лишнее с 20 экранов за 10 минут.
Если скан похож на шаблон, то алгоритм такой
1. Определить наклон таблицы по левой границе таблицы.
2. Выровнять.
3. Определить ширину таблицы
4. Привести ширину таблицы к ширине шаблона.
5. Сравнить шапку таблицы и подписи с шаблоном.

Пятый пункт объяснять не надо?


 
картман ©   (2012-04-29 00:13) [14]


> Цукор5   (28.04.12 17:23) [10]

заполненно - часть шаблона?


 
Цукор5   (2012-04-30 00:28) [15]

2 картман ©   (29.04.12 00:13) [14]

Почему же? Весь. Всегда такой лист с такой таблицей. Данные в таблице...да, отличаются на каждом листе.


 
KilkennyCat ©   (2012-04-30 11:18) [16]


> sniknik ©   (28.04.12 14:02) [4]

неидеальный тест, одинаковые все.


> Наиль ©   (28.04.12 20:27) [13]

лучшее решение.


 
KSergey ©   (2012-04-30 20:08) [17]

А чем плоха первая картинка из "не по шаблону"? не та шапка?


 
asail ©   (2012-04-30 20:33) [18]

Имхо, задачка практически не подъемная для одиночки... Учитывая всякие там деффекты сканирования (типа прерывания сплошных линий, лишних линий из-за мусора и т.д.), то даже для ABBY задачка та еще, в общем случае...
Может, можно подкорректировать шаблон - метки какие ставить легко определяемые (по углам например, как у 2Д баркодов)? Или шаблон, "свыше" дан?


 
Омлет ©   (2012-04-30 21:20) [19]


> выбрать оптимальное и правильное

ABBYY FlexiCapture Engine.


 
RDen ©   (2012-05-01 10:34) [20]

студента(ов) на практику взять



Страницы: 1 вся ветка

Текущий архив: 2013.03.22;
Скачать: CL | DM;

Наверх




Память: 0.51 MB
Время: 0.055 c
15-1338590317
М
2012-06-02 02:38
2013.03.22
Как лучше оформить строку аттрибутов?


15-1335549150
Влад
2012-04-27 21:52
2013.03.22
Сколько Калькуляторов получится открыть максимально?


15-1350915204
Дмитрий С
2012-10-22 18:13
2013.03.22
exe с номером билда


2-1337677823
leklerk
2012-05-22 13:10
2013.03.22
функция NetMessageBufferSend


15-1331297566
Дмитрий С
2012-03-09 16:52
2013.03.22
Следят блин.