Форум: "Media";
Текущий архив: 2002.08.08;
Скачать: [xml.tar.bz2];
ВнизРаспознование голоса. Найти похожие ветки
← →
Di_wind (2002-03-30 22:57) [0]Кто-нибудь интересовался? Поделитесь пожалуйса опытом. Где почитать, есть-ли вообще качестеные алгоритмы, с чего начать и т.д
← →
Doom (2002-03-31 00:29) [1]В общем случае (попроще) - разбиение речи на отрывки и сравнение их с эталонами слов при помощи колланарных (по-моему так ) функций. Так как это делают программы по рповерке произношения на английском языке
← →
Sergey_n (2002-03-31 01:07) [2]Ну а если покопаться в MSDN на слово Speech SDK, в принципе система распознования и произношения (DLL-ки) уже поставляется с XP, надо просто покопаться в MSDN.
← →
Stexen (2002-03-31 01:19) [3]Да сам как то помнится капался с этим делом с произношением даже свой енджин написал не так то сложно а вот с распознованием ваще траблы нигде даже примерных алгоритмов не мог найти тут наверняка без нейросетй необошлось а вот про них инфы много в инете лежит так что если еще интересует советую с нее начать так например я сделал распознование текста... то есть с речью это же звуковой поток то есть так же как то надо анализировать сетями...
← →
yaJohn (2002-04-03 15:12) [4]Сети напрямую не пойдут. Медленно.
Для начала по амплитуде делят на слова. Потом спектральный анализ.
Проще всего распознаются гласные. Обычно комбинация двух тонов. Ну и плюс гармоники.
С согласными - беда. Но в принципе приемлемого качества можно и на одних гласных добиться (наверное). Вон, в иврите, гласные вообще не пишутся, и ничего, читают и понимают.
А уже разложенный по комбинациям тонов сигнал (частота дискретизации около 30-50 гц) можно и на сетку.
Т.е. ситуация такова: научить систему стенографии - задачка на ближайшее десятилетие. И не для одного человека. А вот обучить ее понимать десяток команд - можно.
Сходи еще сюда: http://book.itep.ru/2/24/vcod_242.htm
Страницы: 1 вся ветка
Форум: "Media";
Текущий архив: 2002.08.08;
Скачать: [xml.tar.bz2];
Память: 0.45 MB
Время: 0.005 c