Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2002.08.08;
Скачать: CL | DM;

Вниз

Распознование голоса.   Найти похожие ветки 

 
Di_wind ©   (2002-03-30 22:57) [0]

Кто-нибудь интересовался? Поделитесь пожалуйса опытом. Где почитать, есть-ли вообще качестеные алгоритмы, с чего начать и т.д


 
Doom ©   (2002-03-31 00:29) [1]

В общем случае (попроще) - разбиение речи на отрывки и сравнение их с эталонами слов при помощи колланарных (по-моему так ) функций. Так как это делают программы по рповерке произношения на английском языке


 
Sergey_n ©   (2002-03-31 01:07) [2]

Ну а если покопаться в MSDN на слово Speech SDK, в принципе система распознования и произношения (DLL-ки) уже поставляется с XP, надо просто покопаться в MSDN.


 
Stexen ©   (2002-03-31 01:19) [3]

Да сам как то помнится капался с этим делом с произношением даже свой енджин написал не так то сложно а вот с распознованием ваще траблы нигде даже примерных алгоритмов не мог найти тут наверняка без нейросетй необошлось а вот про них инфы много в инете лежит так что если еще интересует советую с нее начать так например я сделал распознование текста... то есть с речью это же звуковой поток то есть так же как то надо анализировать сетями...


 
yaJohn ©   (2002-04-03 15:12) [4]

Сети напрямую не пойдут. Медленно.
Для начала по амплитуде делят на слова. Потом спектральный анализ.
Проще всего распознаются гласные. Обычно комбинация двух тонов. Ну и плюс гармоники.
С согласными - беда. Но в принципе приемлемого качества можно и на одних гласных добиться (наверное). Вон, в иврите, гласные вообще не пишутся, и ничего, читают и понимают.
А уже разложенный по комбинациям тонов сигнал (частота дискретизации около 30-50 гц) можно и на сетку.
Т.е. ситуация такова: научить систему стенографии - задачка на ближайшее десятилетие. И не для одного человека. А вот обучить ее понимать десяток команд - можно.

Сходи еще сюда: http://book.itep.ru/2/24/vcod_242.htm



Страницы: 1 вся ветка

Текущий архив: 2002.08.08;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.01 c
3-23925
Sam
2002-07-17 18:55
2002.08.08
ADOQuery.Locate дает ошибку Record not found?


1-24051
Folk
2002-07-25 14:54
2002.08.08
Где в Интернете можно скачать звуки?


1-24097
wowa
2002-07-26 15:47
2002.08.08
Delphi и C


14-24205
Ильдар
2002-07-13 13:51
2002.08.08
Где?


3-23907
sniknik
2002-07-17 12:19
2002.08.08
Метод на обсуждение, рефреш датасета измененного копией программы