Форум: "Media";
Текущий архив: 2004.04.25;
Скачать: [xml.tar.bz2];
ВнизРЕЧЬ, ЕЕ рапознование.... Найти похожие ветки
← →
Ianus © (2004-01-17 18:50) [0]Я не раз обращался с этим вопросом в форум, но конкретных ответов не получил... Итак, еще раз, попоробую переформулировать вопрос: КаК можно сравнить два звуковых файла с речью человека и вывести совпадают или нет. Если возможно, то пришли те на e-mail или дайте ссылку на код какой-нить работающей програмы, выполняющую сходную функцию... Заранее спасибо, МАСТЕРА.
← →
Yr2 (2004-01-17 19:15) [1]Вы не представляете, как Вы далеки от цели...
"Сравнить" два файла - это ещё не распознать речь... Распознавание пытаются делать с помощью преобразования Фурье, с помощью корреляционного анализа, Марковскими процессами, нейросетевыми технологиями и т.д... А воз и ныне там..
посмотрите хотя бы
http://art.bdk.com.ru/govor/doc.htm
← →
Mihey © (2004-01-17 19:16) [2]Не получил ты ответа, потому что так не делается. Распознавание речи - офигенно сложно. Для русского языка оно почти не реализовано (есть пока несколько движков, действующих солидно). Кода, который реализует это, нигде ты не найдёшь. Зато может попадётся код, использующий какую-либо библиотеку. Так что ищи.
← →
Ianus © (2004-01-18 13:44) [3]Черт, опять неправильно выразился...
Всмысле не распознать речь, а просто поанализировать на совпадение двух звуковых файлов... Так, как я понимаю, реализуется голосовой набор в мобильных телефонах - ты записываешь метку голосовую - сопоставляешь ее с номером телефона, потом произносишь её, телефон находит подобную запись и набирает номер... Ух...
← →
Mihey © (2004-01-18 19:32) [4]Это по тембру голоса.
← →
Aleksey © (2004-01-19 10:52) [5]Попробуй сравнивать размер, длину, частоту, битрейд...
← →
Brahman © (2004-01-19 10:57) [6]Фильтр линейного предсказания
CELP-модель
Кодек G.729
Если это не отобьет охоту, то поздравляю.
← →
Ianus © (2004-01-19 20:18) [7]а по русски ? :)
---
Мож сылочку какую дадите?.. или кодик какой-ить там? ;)
← →
Yr2 (2004-01-19 23:00) [8]а Вы сначала детально посмотрите на графическое представление речи. Программы работы со звуком есть, например здесь:
http://www.blazeaudio.com/?app=wst
http://www.dsp.sut.ru/edsw/index.html
← →
Ianus © (2004-01-20 20:17) [9]ммм... да! Thanks... Сейчас поспосмотрим
Страницы: 1 вся ветка
Форум: "Media";
Текущий архив: 2004.04.25;
Скачать: [xml.tar.bz2];
Память: 0.46 MB
Время: 0.033 c