Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2004.04.25;
Скачать: CL | DM;

Вниз

РЕЧЬ, ЕЕ рапознование....   Найти похожие ветки 

 
Ianus ©   (2004-01-17 18:50) [0]

Я не раз обращался с этим вопросом в форум, но конкретных ответов не получил... Итак, еще раз, попоробую переформулировать вопрос: КаК можно сравнить два звуковых файла с речью человека и вывести совпадают или нет. Если возможно, то пришли те на e-mail или дайте ссылку на код какой-нить работающей програмы, выполняющую сходную функцию... Заранее спасибо, МАСТЕРА.


 
Yr2   (2004-01-17 19:15) [1]

Вы не представляете, как Вы далеки от цели...
"Сравнить" два файла - это ещё не распознать речь... Распознавание пытаются делать с помощью преобразования Фурье, с помощью корреляционного анализа, Марковскими процессами, нейросетевыми технологиями и т.д... А воз и ныне там..
посмотрите хотя бы
http://art.bdk.com.ru/govor/doc.htm


 
Mihey ©   (2004-01-17 19:16) [2]

Не получил ты ответа, потому что так не делается. Распознавание речи - офигенно сложно. Для русского языка оно почти не реализовано (есть пока несколько движков, действующих солидно). Кода, который реализует это, нигде ты не найдёшь. Зато может попадётся код, использующий какую-либо библиотеку. Так что ищи.


 
Ianus ©   (2004-01-18 13:44) [3]

Черт, опять неправильно выразился...
Всмысле не распознать речь, а просто поанализировать на совпадение двух звуковых файлов... Так, как я понимаю, реализуется голосовой набор в мобильных телефонах - ты записываешь метку голосовую - сопоставляешь ее с номером телефона, потом произносишь её, телефон находит подобную запись и набирает номер... Ух...


 
Mihey ©   (2004-01-18 19:32) [4]

Это по тембру голоса.


 
Aleksey ©   (2004-01-19 10:52) [5]

Попробуй сравнивать размер, длину, частоту, битрейд...


 
Brahman ©   (2004-01-19 10:57) [6]

Фильтр линейного предсказания
CELP-модель
Кодек G.729

Если это не отобьет охоту, то поздравляю.


 
Ianus ©   (2004-01-19 20:18) [7]

а по русски ? :)
---
Мож сылочку какую дадите?.. или кодик какой-ить там? ;)


 
Yr2   (2004-01-19 23:00) [8]

а Вы сначала детально посмотрите на графическое представление речи. Программы работы со звуком есть, например здесь:
http://www.blazeaudio.com/?app=wst
http://www.dsp.sut.ru/edsw/index.html


 
Ianus ©   (2004-01-20 20:17) [9]

ммм... да! Thanks... Сейчас поспосмотрим



Страницы: 1 вся ветка

Текущий архив: 2004.04.25;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.022 c
1-1081630542
Klopan
2004-04-11 00:55
2004.04.25
массовое прописывание BackGround а


6-1077828231
Pavel
2004-02-26 23:43
2004.04.25
IP


1-1081241753
Openfire
2004-04-06 12:55
2004.04.25
Вопрос про экспорт данных в MSWord


14-1080812408
}|{yk
2004-04-01 13:40
2004.04.25
Какой позор...


1-1081264515
Norfolk
2004-04-06 19:15
2004.04.25
Запись TStrings в файл