Форум: "Media";
Текущий архив: 2006.02.12;
Скачать: [xml.tar.bz2];
Внизанализ отсканированного изображения Найти похожие ветки
← →
SuSanin (2005-08-29 13:18) [0]Есть отсканированный текст, его еще не распознали но уже очистили от шумов, сделали цвето коррекцию и т.п.
Необходимо найти на данном изображениии рисунок среди текста (он там есть, мы знаем!!, а комп нет). Нужен алгоритм поиска картинок на отсканированных изображениях.
принимаются любые толковые мысли. Про проги писать не надо, если нет их исходников.
← →
Digitman © (2005-08-29 13:49) [1]
> толковые мысли
мысль не изобретать очередной веросипед, а воспользоваться ГОТОВЫМ интерфейсом ГОТОВОГО объекта автоматизации - программы FineReader, будет "толковой" ?
← →
PAVIA © (2005-08-29 13:58) [2]Выделяем блоки. Блок -множество пикселей ограниченных замкнутым контуром.Пиксели внутри блока находяться на близком растоянии друг от друга, 1-5 пикселя.
Пробуем распознать текст в блоке, если удается то текст, иначе картинка.
← →
Наиль © (2005-08-29 14:13) [3]
> Пробуем распознать текст в блоке
:-)
Как правило рисунок это прямоугольник большого размера.
В общем случае - контур большого размера.
Для определения контура точки окружёные не белыми точками делаешь белыми. Останутся только границы фигур. А дальше
> Пиксели
> находяться на близком растоянии друг от друга,
> 1-5 пикселя.
вот тебе и контур.
← →
Чапаев © (2005-08-29 14:46) [4]Типичная задача сегментации изображения. Ищи большой (значительно больший размера буквы) участок нефонового цвета.
← →
Jeer © (2005-08-29 15:35) [5]А лучше все наоборот.
Текст распознать проще - некая систематическая структура.
После нахождения символов текста отсекаем их.
Остается изображение.
Если об изображении заранее ничего не известно, то это единственный устойчивый алгоритм.
← →
Чапаев © (2005-08-29 15:56) [6]> После нахождения символов текста отсекаем их.
Не совсем так. На практике удобней отсекать СТРОКИ текста, а не символы.
← →
Jeer © (2005-08-30 14:57) [7]Чапаев © (29.08.05 15:56) [6]
Ну и что такое строка текста ?
Прямоугольная область внутри которой расположены символы ?
Тогда неверно, т.к. будут отсечено все что непокрыто символами.
Итого - отсекать символы с использованием совета [1]
← →
SuSanin (2005-08-31 12:09) [8]Первое, спасибо всем за мысли.
2. Пишу программу предобработки (очистки, фильтрации,...) растрового изображения до распозновния.
3. Распознование НЕ пишу.
4. Рис. могут быть малого размера и лежать в строке с текстом. Типа нажмите на эту ... кнопку.
5. И еще, как разбили на блоки ??
6. Есть идея наити среднее значение по строкам. сложить-> поделить на кол-во пикс. в строке-> построить график -> типа синусойда, где откланения там картинка. Но это по координаты по высоте, а как найти по ширине?
Страницы: 1 вся ветка
Форум: "Media";
Текущий архив: 2006.02.12;
Скачать: [xml.tar.bz2];
Память: 0.46 MB
Время: 0.038 c