Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Media";
Текущий архив: 2004.10.31;
Скачать: [xml.tar.bz2];

Вниз

"Распознать" звук   Найти похожие ветки 

 
Itap ©   (2004-08-01 15:28) [0]

Есть ли идеи по поводу того как научить программу различать звуки. Естественно, вводимые звуки сравниваются с уже имеющимися. По каким параметрам их сравнивать?


 
Digitman ©   (2004-08-03 09:14) [1]


> По каким параметрам их сравнивать?


по динамике изменения составляющих спектра


 
WondeRu ©   (2004-08-03 09:31) [2]

чет на ум приходит только корреляционный анализ, хотя он тут вряд ли поможет!


 
EugeneP   (2004-08-03 10:28) [3]

Существует огромное количество параметров для распознавания звука.
Все зависит от конкретной задачи.
Какие звуки...
Степень точности...
И что собственно из звука нужно распознать...


 
Itap ©   (2004-08-03 12:00) [4]

EugeneP
>Существует огромное количество параметров для распознавания >звука.
>Все зависит от конкретной задачи.
>Какие звуки...
>Степень точности...
>И что собственно из звука нужно распознать...

Программа будет преобразовывать человеческую речь (путём идентификации звуков) в текст и на основе команд (преобразованных в текст) выполнять запрограммированные для этих команд действия.

Digitman ©
>по динамике изменения составляющих спектра
да я думаю буду так делать, но чувствую с некоторыми сочетаниями слогов, на первых этапах, явно возникнут пробемы.


 
Digitman ©   (2004-08-03 16:43) [5]


> Itap


существуют готовые алгоритмы фонемного анализа/синтеза, в той или иной мере успешно решающие твою задачу - зачем изобретать велосипед ?


 
debuger ©   (2004-08-03 16:47) [6]

Спектральный анализ, как мне это кажеться. Так же если нужна класификация, то где-то что-то подобное можно сделать нейронными сетями.

2 WondeRu: именно он хорошо поможет.

Звук равномерно квантуется на очень маленькие отрезки, и каждый расшифровывается(по спектру конечно же), а потом делаете с того, что выйдет бесконтекстный язык и сганяете полученное уже в слова и т.д.


 
to666a ©   (2004-08-04 10:06) [7]

Семь бед, один ответ - FFT (Fast Fourie Transform)+всякие примочки. Сам парюсь пятый месяц... Потихоньку, но прогресс идет. Полазий по инету, а именно: narod.dspbooks.ru (мож немного не верно), а вообще ищи FFT, DSP, DSP Books посмотри www.dspguide.com. Если что пиши.
                               С уважением, to666a.



Страницы: 1 вся ветка

Форум: "Media";
Текущий архив: 2004.10.31;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.46 MB
Время: 0.037 c
4-1096091662
Zombik
2004-09-25 09:54
2004.10.31
Как закрыть окно с содержимым CD ?


3-1096969715
Lord de Mon
2004-10-05 13:48
2004.10.31
Copy


1-1097561439
-=SS=-
2004-10-12 10:10
2004.10.31
Изменение цвета кнопки


1-1097780570
Aleks
2004-10-14 23:02
2004.10.31
Вывод графика из TChart в браузер


1-1097338188
temp2
2004-10-09 20:09
2004.10.31
Как показать окно сообщения MessageDlg со своими надписями кнопок





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский