Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Media";
Текущий архив: 2004.10.31;
Скачать: [xml.tar.bz2];

Вниз

"Распознать" звук   Найти похожие ветки 

 
Itap ©   (2004-08-01 15:28) [0]

Есть ли идеи по поводу того как научить программу различать звуки. Естественно, вводимые звуки сравниваются с уже имеющимися. По каким параметрам их сравнивать?


 
Digitman ©   (2004-08-03 09:14) [1]


> По каким параметрам их сравнивать?


по динамике изменения составляющих спектра


 
WondeRu ©   (2004-08-03 09:31) [2]

чет на ум приходит только корреляционный анализ, хотя он тут вряд ли поможет!


 
EugeneP   (2004-08-03 10:28) [3]

Существует огромное количество параметров для распознавания звука.
Все зависит от конкретной задачи.
Какие звуки...
Степень точности...
И что собственно из звука нужно распознать...


 
Itap ©   (2004-08-03 12:00) [4]

EugeneP
>Существует огромное количество параметров для распознавания >звука.
>Все зависит от конкретной задачи.
>Какие звуки...
>Степень точности...
>И что собственно из звука нужно распознать...

Программа будет преобразовывать человеческую речь (путём идентификации звуков) в текст и на основе команд (преобразованных в текст) выполнять запрограммированные для этих команд действия.

Digitman ©
>по динамике изменения составляющих спектра
да я думаю буду так делать, но чувствую с некоторыми сочетаниями слогов, на первых этапах, явно возникнут пробемы.


 
Digitman ©   (2004-08-03 16:43) [5]


> Itap


существуют готовые алгоритмы фонемного анализа/синтеза, в той или иной мере успешно решающие твою задачу - зачем изобретать велосипед ?


 
debuger ©   (2004-08-03 16:47) [6]

Спектральный анализ, как мне это кажеться. Так же если нужна класификация, то где-то что-то подобное можно сделать нейронными сетями.

2 WondeRu: именно он хорошо поможет.

Звук равномерно квантуется на очень маленькие отрезки, и каждый расшифровывается(по спектру конечно же), а потом делаете с того, что выйдет бесконтекстный язык и сганяете полученное уже в слова и т.д.


 
to666a ©   (2004-08-04 10:06) [7]

Семь бед, один ответ - FFT (Fast Fourie Transform)+всякие примочки. Сам парюсь пятый месяц... Потихоньку, но прогресс идет. Полазий по инету, а именно: narod.dspbooks.ru (мож немного не верно), а вообще ищи FFT, DSP, DSP Books посмотри www.dspguide.com. Если что пиши.
                               С уважением, to666a.



Страницы: 1 вся ветка

Форум: "Media";
Текущий архив: 2004.10.31;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.46 MB
Время: 0.04 c
14-1097138479
Lool
2004-10-07 12:41
2004.10.31
Задача по геометрии


14-1096854563
Думкин
2004-10-04 05:49
2004.10.31
С днем рождения! 4 октября


8-1091344032
race1
2004-08-01 11:07
2004.10.31
mpeg header


14-1097793389
Snap
2004-10-15 02:36
2004.10.31
Installer893.exe


3-1096522956
Morj
2004-09-30 09:42
2004.10.31
DBF в ДОСовой





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский