Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Media";
Текущий архив: 2004.10.31;
Скачать: [xml.tar.bz2];

Вниз

"Распознать" звук   Найти похожие ветки 

 
Itap ©   (2004-08-01 15:28) [0]

Есть ли идеи по поводу того как научить программу различать звуки. Естественно, вводимые звуки сравниваются с уже имеющимися. По каким параметрам их сравнивать?


 
Digitman ©   (2004-08-03 09:14) [1]


> По каким параметрам их сравнивать?


по динамике изменения составляющих спектра


 
WondeRu ©   (2004-08-03 09:31) [2]

чет на ум приходит только корреляционный анализ, хотя он тут вряд ли поможет!


 
EugeneP   (2004-08-03 10:28) [3]

Существует огромное количество параметров для распознавания звука.
Все зависит от конкретной задачи.
Какие звуки...
Степень точности...
И что собственно из звука нужно распознать...


 
Itap ©   (2004-08-03 12:00) [4]

EugeneP
>Существует огромное количество параметров для распознавания >звука.
>Все зависит от конкретной задачи.
>Какие звуки...
>Степень точности...
>И что собственно из звука нужно распознать...

Программа будет преобразовывать человеческую речь (путём идентификации звуков) в текст и на основе команд (преобразованных в текст) выполнять запрограммированные для этих команд действия.

Digitman ©
>по динамике изменения составляющих спектра
да я думаю буду так делать, но чувствую с некоторыми сочетаниями слогов, на первых этапах, явно возникнут пробемы.


 
Digitman ©   (2004-08-03 16:43) [5]


> Itap


существуют готовые алгоритмы фонемного анализа/синтеза, в той или иной мере успешно решающие твою задачу - зачем изобретать велосипед ?


 
debuger ©   (2004-08-03 16:47) [6]

Спектральный анализ, как мне это кажеться. Так же если нужна класификация, то где-то что-то подобное можно сделать нейронными сетями.

2 WondeRu: именно он хорошо поможет.

Звук равномерно квантуется на очень маленькие отрезки, и каждый расшифровывается(по спектру конечно же), а потом делаете с того, что выйдет бесконтекстный язык и сганяете полученное уже в слова и т.д.


 
to666a ©   (2004-08-04 10:06) [7]

Семь бед, один ответ - FFT (Fast Fourie Transform)+всякие примочки. Сам парюсь пятый месяц... Потихоньку, но прогресс идет. Полазий по инету, а именно: narod.dspbooks.ru (мож немного не верно), а вообще ищи FFT, DSP, DSP Books посмотри www.dspguide.com. Если что пиши.
                               С уважением, to666a.



Страницы: 1 вся ветка

Форум: "Media";
Текущий архив: 2004.10.31;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.46 MB
Время: 0.039 c
14-1097250813
Shurik_212
2004-10-08 19:53
2004.10.31
Неохота убивать винду


1-1097589032
П7
2004-10-12 17:50
2004.10.31
Анимированне обои раб.стола


9-1088492992
ПЛОВ
2004-06-29 11:09
2004.10.31
Работа OGL под ХР


1-1097870045
Мирон
2004-10-15 23:54
2004.10.31
TXPManifest уличен во вредительстве


14-1097482918
ORMADA
2004-10-11 12:21
2004.10.31
Зацените прогу





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский