Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2002.08.08;
Скачать: CL | DM;

Вниз

Распознование голоса.   Найти похожие ветки 

 
Di_wind ©   (2002-03-30 22:57) [0]

Кто-нибудь интересовался? Поделитесь пожалуйса опытом. Где почитать, есть-ли вообще качестеные алгоритмы, с чего начать и т.д


 
Doom ©   (2002-03-31 00:29) [1]

В общем случае (попроще) - разбиение речи на отрывки и сравнение их с эталонами слов при помощи колланарных (по-моему так ) функций. Так как это делают программы по рповерке произношения на английском языке


 
Sergey_n ©   (2002-03-31 01:07) [2]

Ну а если покопаться в MSDN на слово Speech SDK, в принципе система распознования и произношения (DLL-ки) уже поставляется с XP, надо просто покопаться в MSDN.


 
Stexen ©   (2002-03-31 01:19) [3]

Да сам как то помнится капался с этим делом с произношением даже свой енджин написал не так то сложно а вот с распознованием ваще траблы нигде даже примерных алгоритмов не мог найти тут наверняка без нейросетй необошлось а вот про них инфы много в инете лежит так что если еще интересует советую с нее начать так например я сделал распознование текста... то есть с речью это же звуковой поток то есть так же как то надо анализировать сетями...


 
yaJohn ©   (2002-04-03 15:12) [4]

Сети напрямую не пойдут. Медленно.
Для начала по амплитуде делят на слова. Потом спектральный анализ.
Проще всего распознаются гласные. Обычно комбинация двух тонов. Ну и плюс гармоники.
С согласными - беда. Но в принципе приемлемого качества можно и на одних гласных добиться (наверное). Вон, в иврите, гласные вообще не пишутся, и ничего, читают и понимают.
А уже разложенный по комбинациям тонов сигнал (частота дискретизации около 30-50 гц) можно и на сетку.
Т.е. ситуация такова: научить систему стенографии - задачка на ближайшее десятилетие. И не для одного человека. А вот обучить ее понимать десяток команд - можно.

Сходи еще сюда: http://book.itep.ru/2/24/vcod_242.htm



Страницы: 1 вся ветка

Текущий архив: 2002.08.08;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.013 c
1-24001
Helg
2002-07-28 09:39
2002.08.08
Как перехватывать обработчики ошибок?


3-23930
Ag2002
2002-07-18 14:56
2002.08.08
Grid


14-24196
SDK
2002-07-13 06:22
2002.08.08
SDK


14-24238
Феликс
2002-07-11 19:09
2002.08.08
Объясните (если вам не сложно, конечно!) принцип шифрования.


14-24200
race1
2002-07-14 07:44
2002.08.08
рассылка