Форум: "Прочее";
Текущий архив: 2013.03.22;
Скачать: [xml.tar.bz2];
ВнизСортировка изображений по "содержимому" Найти похожие ветки
← →
Цукор5 (2012-04-28 13:22) [0]Есть несколько тысяч файлов (TIF), полученных в результате сканирования. Иногда, случайным образом сканируются листы не по шаблону. Задача: создать приложение, которое бы проверяло, соответствует ли файл шаблону.
Готовое решение мне не нужно. Я лишь интересуюсь возможными вариантами решения, чтобы выбрать оптимальное и правильное. Очень важно получить совет о нужное книге, если действительно есть что посоветовать.
Пока вижу такие варианты:
- задействовать нейронную сеть (никогда не работал с нею).
- вырезать часть изображения и искать на любом файле совпадения.
Спасибо.
← →
Цукор5 (2012-04-28 13:24) [1]Ссылки на изображения дать не могу — форум удаляет посты с ссылками. Уж не знаю почему.
← →
Думкин © (2012-04-28 13:48) [2]
> форум удаляет посты с ссылками. Уж не знаю почему.
http://delphimaster.ru/cgi-bin/forum.pl?n=3
← →
Rouse_ © (2012-04-28 13:51) [3]
> Цукор5 (28.04.12 13:24) [1]
> Ссылки на изображения дать не могу — форум удаляет посты
> с ссылками. Уж не знаю почему.
больше 4 ссылок в сообщении считается спамом и трется автоматически...
← →
sniknik © (2012-04-28 14:02) [4]http://delphimaster.net/view/15-1335604943/
http://delphimaster.net/view/15-1335604943/
http://delphimaster.net/view/15-1335604943/
http://delphimaster.net/view/15-1335604943/
http://delphimaster.net/view/15-1335604943/
← →
БарЛог © (2012-04-28 14:17) [5]А я побоялся проверять :)
← →
Цукор5 (2012-04-28 16:23) [6]Господа, а по теме?
← →
han_malign (2012-04-28 16:35) [7]
> форум удаляет посты с ссылками. Уж не знаю почему.
> sniknik ©
← →
CRLF (2012-04-28 16:36) [8]
> Готовое решение мне не нужно.
То есть принципиально нужно сделать самому? Или "не подумайте, что я хочу исходники выпросить"?
← →
MBo © (2012-04-28 16:47) [9]Стоило бы посмотреть образцы по шаблону и не по шаблону - пару ссылок-то форум должен пропустить.
Возможно, простым способом будет применение OpenCV. Протестировать подходы можно и в Matlab
← →
Цукор5 (2012-04-28 17:23) [10]По шаблону: http://gyazo.com/9310816212b19de18b0dff2102351256
← →
Цукор5 (2012-04-28 17:24) [11]Не по шаблону:
http://gyazo.com/fd0b9ee3d583b0c21fb89b73ac071fcb
http://gyazo.com/fff7cd2c26ba9cbf7e7488d0810615c7
← →
MBo © (2012-04-28 17:53) [12]Картинка по шаблону не отображается. А не по шаблону - видно.
← →
Наиль © (2012-04-28 20:27) [13]Для отсеивания очевидных косяков можно использовать миниатюры.
Показывать по 50 шт на экране.
Для тысячи штук это будет 20 экранов.
Человек может выкинуть всё лишнее с 20 экранов за 10 минут.
Если скан похож на шаблон, то алгоритм такой
1. Определить наклон таблицы по левой границе таблицы.
2. Выровнять.
3. Определить ширину таблицы
4. Привести ширину таблицы к ширине шаблона.
5. Сравнить шапку таблицы и подписи с шаблоном.
Пятый пункт объяснять не надо?
← →
картман © (2012-04-29 00:13) [14]
> Цукор5 (28.04.12 17:23) [10]
заполненно - часть шаблона?
← →
Цукор5 (2012-04-30 00:28) [15]2 картман © (29.04.12 00:13) [14]
Почему же? Весь. Всегда такой лист с такой таблицей. Данные в таблице...да, отличаются на каждом листе.
← →
KilkennyCat © (2012-04-30 11:18) [16]
> sniknik © (28.04.12 14:02) [4]
неидеальный тест, одинаковые все.
> Наиль © (28.04.12 20:27) [13]
лучшее решение.
← →
KSergey © (2012-04-30 20:08) [17]А чем плоха первая картинка из "не по шаблону"? не та шапка?
← →
asail © (2012-04-30 20:33) [18]Имхо, задачка практически не подъемная для одиночки... Учитывая всякие там деффекты сканирования (типа прерывания сплошных линий, лишних линий из-за мусора и т.д.), то даже для ABBY задачка та еще, в общем случае...
Может, можно подкорректировать шаблон - метки какие ставить легко определяемые (по углам например, как у 2Д баркодов)? Или шаблон, "свыше" дан?
← →
Омлет © (2012-04-30 21:20) [19]
> выбрать оптимальное и правильное
ABBYY FlexiCapture Engine.
← →
RDen © (2012-05-01 10:34) [20]студента(ов) на практику взять
Страницы: 1 вся ветка
Форум: "Прочее";
Текущий архив: 2013.03.22;
Скачать: [xml.tar.bz2];
Память: 0.48 MB
Время: 0.07 c