Распознавание изображений

← →
analyzer (2005-06-28 08:35) [0]

Заинтересовался темой распознавания изображений в приложении к идентификации пользователя по изображению с видеокамеры.Кто может подсказать где найти документацию,исходники по этой теме.Заранее спасибо.

← →
XProger © (2005-06-28 09:11) [1]

В секретных лабораториях робототехники НИИ США

← →
analyzer (2005-06-28 09:41) [2]

)...а адресс не подскажешь...

← →
kot andrei (2005-06-28 11:50) [3]

а способы распознать контуры, самого близкого к камере объекта, известны?

← →
analyzer (2005-06-28 13:48) [4]

речь пока идет только об обработке одного объекта ,который будет получаться просто из bmp-файла,а выборка и обработка объектов из
множества это дело не срочное.

Хоть кто-нибудь что-нибудь по этой теме знает пусть поделится.
Пока мне известно только что нужно по изображению создать формальную модель с описанием прямых,кривых (или еще чегонить),а потом сравнивать ее с моделью которая будет формироваться из сравниваемого изображния...Только как это сделать другой вопрос..

← →
programania © (2005-06-28 21:52) [5]

>Хоть кто-нибудь что-нибудь по этой теме знает пусть поделится.

Знаю очевидные вещи:
Надо сравнивать образец с текущим изображением
Образец может быть в любом месте, любого размера и поворота
поэтому надо сравнивать все его возможные варианты
Основная проблема при этом чтоб хватило времени
Для этого нужно уменьшить разрешение образца и изображения
пока еще что-то можно распознать глазами.
Или даже сильнее чтоб только ограничить возможные области а потом уточнить.
Но в реальном мире один и тот же предмет выглядит всегда по разному
и образцов будет много, поэтому для большего ускорения
имеет смысл сравнивать сначала части образцов типа прямых,кривых,(или еще чегонить)
которые чаще встречаются, потому что их меньше по числу и размеру,
а потом уточнять возможные места.
А сравнивать по частям можно также как по пикселам
только вместо яркости будет номер части возможно не один.
Кстати, аналогично и со звуком.

← →
Анонимщики © (2005-06-28 23:18) [6]

Откуда вы только такие шустрые беретесь?

← →
PAVIA © (2005-06-29 00:45) [7]

Распознавание образов тема обширная. Ею занимаются очень давно и многие. Еще в 60 годах были сделаны ПЕРСЕПТРОНЫ первые машины, которые могли распознавать изображения. Они были основаны на простых нееро сетях. Которые сравнивали по пиксельно. Еще есть Быстрые Преобразования Фурье (БПФ/FFT). Можно построить формальную модель, и ее сравнить с эталоном. В современных устройствах для распознавания образов строят трехмерную модель. Для построения 3D-модели используют специальную камеру, либо две штуки под разными углами - это нужно для расчеты глубины.
Если говорить о 2-мерной модели, то и здесь есть несколько подходов для ее построения. Для векторизации используют метод выделения граничных линий или другие методы.

← →
frame © (2005-06-29 01:55) [8]

Любая книга по нелинейной оптике -> постороение фурье-образа - вот всё, что тебе нужно.
Если сравниваь по фурье-образам, то можно даже различать формы объектов (например, ворону от воробья), даже если изображение увеличено, повернуто и т.п. Вообщем учите мат. часть ))

← →
WondeRu © (2005-06-29 08:40) [9]

frame © (29.06.05 1:55) [8]
Если сравниваь по фурье-образам
Че это за хрень такая???

← →
WondeRu © (2005-06-29 08:41) [10]

Анонимщики © (28.06.05 23:18) [6]
Откуда вы только такие шустрые беретесь?
)
Недавно мне попался закрытый обзорчик одного видного к.т.н. в области видеодетекторов... там мысль: "В настоящий момент видеодетекторов толком нет, есть только детекторы активности..."

← →
Анонимщики © (2005-06-29 11:22) [11]

>>WondeRU
Ну, это известно и из открытых источников - видел это в форуме каком-то, там директора Мегапиксела разорялся на эту тему (ну и себя рекламировал, чсное дело).
Но это не совсем верно. В той же OpenCV есть пример, называется, кажется, что-то вроде то ли OpticalFlow, то ли еще что-то. Движущееся изображение достаточно четко сегментируется по областям разного направления движения.
Но рекомендовать что-то конкретное тут нельзя из-за обширности темы. Нужно брать любую книгу на соответсвующую тему и читать - после этого будет кое-какой кругозор. Из программных продуктов - OpenCV.
Больше мне почти нечего сказать.

← →
Thaddy (2005-06-29 11:35) [12]

In Photo recognition or Photo biometrics
the simplest basics for still images taken from front of face are such:

1) Line from left ear over eyes to right ear.
Dots on center of both eyes.
2) Triangle over ears and chin
3) Triangle over eyes and nose
4) extended triangle over eyes and mouth edges

premises:
- every face is unique (except for twins)
- The lines and dots can be scaled and are constant within narrow margins
- The triangles can be scaled and are constant within narrow margins.

This can be created in software by creating a very oversharp
and over contrasted version of the original photo's and reduce the colors to 16 or 4. This will give an image that can be scanned for
Light / Dark zones.
The smallest left edge found is the left ear.
You can assume the eyes to be on a straight line to the right ear, etc.

The algoritm is very simple to implement, but other, more complex maths are used to enhance recognition.
Results with this are already pretty good however.
Note this algorithm is patented!

← →
frame © (2005-06-29 23:29) [13]

>WondeRu © (29.06.05 08:40) [9]
Разложение нашего изображение в ряды фурье (по подобию). Если не нравится эта штука, попробуй тогда использовать импульсный отклик. Со всеми вопросами - в библиотеку, так как в интернете на эту тему ничего нет

← →
Анонимщики © (2005-06-30 00:02) [14]

frame
Не говори ерунды

← →
Thaddy (2005-06-30 00:59) [15]

I forgot to add a couple of things:
The most important triangles are
1) eyes to nose tip. Weight 30%
2) eyes via mouth edges downward 20%
3) eyes over edges of chin
4) eyes to tip of chin
5) if ears are not covered or only partally covered the line ear-eye-eye-ear should weigh heavily.

Also note that since the length of the sides of the triangle does not change (very simple basic math!) the face may be partially turned. Also the perspective can be calculated from that property.
Again very simple to solve. All parts of this algoritm are very fast to compute. The most difficult being the edge detection and the perspective.

Also note, although this is patented, this technique dates from the 14th century and is really invented by portrait painters, so prior knowledge should be easy to show ;)

← →
Thaddy (2005-06-30 01:16) [16]

You can easily do this yourself to test it by the way:
Simply test it with two or more photographs of the same person and some others. Then draw the lines!,
Since most of the info is triangular, you only need to compare the three edges of all triangles and the e-e-e-e line in percentages.

This a fun way for children to learn math! And it works very very good in most cases!

Note: if the mouth extends the eye position, ofcourse the triangle should be completed upwards!

A FFT is indeed completely useless by the way, except that it can help determine peaks that indicate light dark centers in the color reduced and oversharpened picture. It is a *secondary* supporting measurement.
However, I consider it not much use due to lighting and shading differences that occur, especially in daylight situations. Edge detection based on scanning is faster, easier and more precise, since you can predict within wich margins to look if two out of three points of the trinagle are known.

← →
Thaddy (2005-06-30 01:33) [17]

Oh:
the more triangles and lines that are possible you use, the better is works. Since it is so simple to compute, even moving images can be recognized since modern computers are fast enough to calculate all frames. For lines, you store the percentages, for triangles the edges.
For children you can use something like:
Given this set of equations, which person belongs to the math?

← →
analyzer (2005-06-30 08:40) [18]

Ого.Всем спасибо.Книгу по нелинейной оптике уже скачал(изуачаю),openCV класная вещь щас тоже буду пробовать юзать,посты
Thaddy тоже очень полезны (где мой любимый Сократ),получается можно лицо описать треугольками...

← →
Thaddy (2005-06-30 10:17) [19]

Yes, and ALL commercial software I know of works like this. All software known to me work with triangulation as you observed. Where i wrote edge, I ment of course angle when referring to triangles!
This is part of my job I work in e-banking and e-payment

http://www.uran.donetsk.ua/~masters/2003/fvti/paukov/library/tri_flash.htm

← →
Thaddy (2005-06-30 20:01) [21]

Interesting thesis and interesting site!
And not one but two! related publications.
(The neural network stuff and the triangulation stuff)
That guy must be a genius.

← →
Thaddy (2005-06-30 20:25) [22]

If people are interested: I consider this a very fun and good subject to start an open source project on sourceforge.
Let's say:

- Design specification in 6 months
- Working prototype with 75% recognistion on still images in 12 months, based on webcam resolution

Who wants in?

I think a somewhat knowledgable (degree in math or related) team of 5 should write the design specs. I can assist and help and maintain.

Mail me at above address. This is really hightech for the masses if we can do it with simple webcams ;)

Распознавание изображений Найти похожие ветки