Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Media";
Текущий архив: 2002.08.08;
Скачать: [xml.tar.bz2];

Вниз

Распознование голоса.   Найти похожие ветки 

 
Di_wind   (2002-03-30 22:57) [0]

Кто-нибудь интересовался? Поделитесь пожалуйса опытом. Где почитать, есть-ли вообще качестеные алгоритмы, с чего начать и т.д


 
Doom   (2002-03-31 00:29) [1]

В общем случае (попроще) - разбиение речи на отрывки и сравнение их с эталонами слов при помощи колланарных (по-моему так ) функций. Так как это делают программы по рповерке произношения на английском языке


 
Sergey_n   (2002-03-31 01:07) [2]

Ну а если покопаться в MSDN на слово Speech SDK, в принципе система распознования и произношения (DLL-ки) уже поставляется с XP, надо просто покопаться в MSDN.


 
Stexen   (2002-03-31 01:19) [3]

Да сам как то помнится капался с этим делом с произношением даже свой енджин написал не так то сложно а вот с распознованием ваще траблы нигде даже примерных алгоритмов не мог найти тут наверняка без нейросетй необошлось а вот про них инфы много в инете лежит так что если еще интересует советую с нее начать так например я сделал распознование текста... то есть с речью это же звуковой поток то есть так же как то надо анализировать сетями...


 
yaJohn   (2002-04-03 15:12) [4]

Сети напрямую не пойдут. Медленно.
Для начала по амплитуде делят на слова. Потом спектральный анализ.
Проще всего распознаются гласные. Обычно комбинация двух тонов. Ну и плюс гармоники.
С согласными - беда. Но в принципе приемлемого качества можно и на одних гласных добиться (наверное). Вон, в иврите, гласные вообще не пишутся, и ничего, читают и понимают.
А уже разложенный по комбинациям тонов сигнал (частота дискретизации около 30-50 гц) можно и на сетку.
Т.е. ситуация такова: научить систему стенографии - задачка на ближайшее десятилетие. И не для одного человека. А вот обучить ее понимать десяток команд - можно.

Сходи еще сюда: http://book.itep.ru/2/24/vcod_242.htm



Страницы: 1 вся ветка

Форум: "Media";
Текущий архив: 2002.08.08;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.45 MB
Время: 0.006 c
14-24195
RV
2002-07-12 11:30
2002.08.08
в продолжение Когда можно работать ?


3-23897
NDR
2002-07-17 20:45
2002.08.08
Как узнать, изменилась ли ячейка? вопрос2:BatchMove ???


1-24044
ValeX
2002-07-23 16:22
2002.08.08
Надо определить: Установлен ли компонент?


6-24139
soho
2002-05-25 18:00
2002.08.08
Сетевой принтер


1-24115
Yuri Btr
2002-07-26 09:35
2002.08.08
Drag&Drop файлов на форму.





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский