Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Прочее";
Текущий архив: 2013.03.22;
Скачать: [xml.tar.bz2];

Вниз

Сортировка изображений по "содержимому"   Найти похожие ветки 

 
Цукор5   (2012-04-28 13:22) [0]

Есть несколько тысяч файлов (TIF), полученных в результате сканирования. Иногда, случайным образом сканируются листы не по шаблону. Задача: создать приложение, которое бы проверяло, соответствует ли файл шаблону.

Готовое решение мне не нужно. Я лишь интересуюсь возможными вариантами решения, чтобы выбрать оптимальное и правильное. Очень важно получить совет о нужное книге, если действительно есть что посоветовать.

Пока вижу такие варианты:
- задействовать нейронную сеть (никогда не работал с нею).
- вырезать часть изображения  и искать на любом файле совпадения.

Спасибо.


 
Цукор5   (2012-04-28 13:24) [1]

Ссылки на изображения дать не могу — форум удаляет посты с ссылками. Уж не знаю почему.


 
Думкин ©   (2012-04-28 13:48) [2]


> форум удаляет посты с ссылками. Уж не знаю почему.

http://delphimaster.ru/cgi-bin/forum.pl?n=3


 
Rouse_ ©   (2012-04-28 13:51) [3]


> Цукор5   (28.04.12 13:24) [1]
> Ссылки на изображения дать не могу — форум удаляет посты
> с ссылками. Уж не знаю почему.

больше 4 ссылок в сообщении считается спамом и трется автоматически...


 
sniknik ©   (2012-04-28 14:02) [4]

http://delphimaster.net/view/15-1335604943/
http://delphimaster.net/view/15-1335604943/
http://delphimaster.net/view/15-1335604943/
http://delphimaster.net/view/15-1335604943/
http://delphimaster.net/view/15-1335604943/


 
БарЛог ©   (2012-04-28 14:17) [5]

А я побоялся проверять :)


 
Цукор5   (2012-04-28 16:23) [6]

Господа, а по теме?


 
han_malign   (2012-04-28 16:35) [7]


> форум удаляет посты с ссылками. Уж не знаю почему.

> sniknik ©


 
CRLF   (2012-04-28 16:36) [8]


> Готовое решение мне не нужно.
То есть принципиально нужно сделать самому? Или "не подумайте, что я хочу исходники выпросить"?


 
MBo ©   (2012-04-28 16:47) [9]

Стоило бы посмотреть образцы по шаблону и не по шаблону - пару ссылок-то форум должен пропустить.
Возможно, простым способом будет применение OpenCV. Протестировать подходы можно и в Matlab


 
Цукор5   (2012-04-28 17:23) [10]

По шаблону: http://gyazo.com/9310816212b19de18b0dff2102351256


 
Цукор5   (2012-04-28 17:24) [11]

Не по шаблону:
http://gyazo.com/fd0b9ee3d583b0c21fb89b73ac071fcb
http://gyazo.com/fff7cd2c26ba9cbf7e7488d0810615c7


 
MBo ©   (2012-04-28 17:53) [12]

Картинка по шаблону не отображается. А не по шаблону - видно.


 
Наиль ©   (2012-04-28 20:27) [13]

Для отсеивания очевидных косяков можно использовать миниатюры.
Показывать по 50 шт на экране.
Для тысячи штук это будет 20 экранов.
Человек может выкинуть всё лишнее с 20 экранов за 10 минут.
Если скан похож на шаблон, то алгоритм такой
1. Определить наклон таблицы по левой границе таблицы.
2. Выровнять.
3. Определить ширину таблицы
4. Привести ширину таблицы к ширине шаблона.
5. Сравнить шапку таблицы и подписи с шаблоном.

Пятый пункт объяснять не надо?


 
картман ©   (2012-04-29 00:13) [14]


> Цукор5   (28.04.12 17:23) [10]

заполненно - часть шаблона?


 
Цукор5   (2012-04-30 00:28) [15]

2 картман ©   (29.04.12 00:13) [14]

Почему же? Весь. Всегда такой лист с такой таблицей. Данные в таблице...да, отличаются на каждом листе.


 
KilkennyCat ©   (2012-04-30 11:18) [16]


> sniknik ©   (28.04.12 14:02) [4]

неидеальный тест, одинаковые все.


> Наиль ©   (28.04.12 20:27) [13]

лучшее решение.


 
KSergey ©   (2012-04-30 20:08) [17]

А чем плоха первая картинка из "не по шаблону"? не та шапка?


 
asail ©   (2012-04-30 20:33) [18]

Имхо, задачка практически не подъемная для одиночки... Учитывая всякие там деффекты сканирования (типа прерывания сплошных линий, лишних линий из-за мусора и т.д.), то даже для ABBY задачка та еще, в общем случае...
Может, можно подкорректировать шаблон - метки какие ставить легко определяемые (по углам например, как у 2Д баркодов)? Или шаблон, "свыше" дан?


 
Омлет ©   (2012-04-30 21:20) [19]


> выбрать оптимальное и правильное

ABBYY FlexiCapture Engine.


 
RDen ©   (2012-05-01 10:34) [20]

студента(ов) на практику взять



Страницы: 1 вся ветка

Форум: "Прочее";
Текущий архив: 2013.03.22;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.48 MB
Время: 0.07 c
15-1333270898
xayam
2012-04-01 13:01
2013.03.22
Ищу устройство


15-1329373822
Димка На
2012-02-16 10:30
2013.03.22
Как узнать кто "мучает" диск?


2-1330501412
AV
2012-02-29 11:43
2013.03.22
Заменяя ProcessMessages


15-1341413403
Artem
2012-07-04 18:50
2013.03.22
mail.ru у вас открывается?


15-1353240876
Чайник
2012-11-18 16:14
2013.03.22
Опять про GuardMailRu





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский