Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2004.04.25;
Скачать: CL | DM;

Вниз

РЕЧЬ, ЕЕ рапознование....   Найти похожие ветки 

 
Ianus ©   (2004-01-17 18:50) [0]

Я не раз обращался с этим вопросом в форум, но конкретных ответов не получил... Итак, еще раз, попоробую переформулировать вопрос: КаК можно сравнить два звуковых файла с речью человека и вывести совпадают или нет. Если возможно, то пришли те на e-mail или дайте ссылку на код какой-нить работающей програмы, выполняющую сходную функцию... Заранее спасибо, МАСТЕРА.


 
Yr2   (2004-01-17 19:15) [1]

Вы не представляете, как Вы далеки от цели...
"Сравнить" два файла - это ещё не распознать речь... Распознавание пытаются делать с помощью преобразования Фурье, с помощью корреляционного анализа, Марковскими процессами, нейросетевыми технологиями и т.д... А воз и ныне там..
посмотрите хотя бы
http://art.bdk.com.ru/govor/doc.htm


 
Mihey ©   (2004-01-17 19:16) [2]

Не получил ты ответа, потому что так не делается. Распознавание речи - офигенно сложно. Для русского языка оно почти не реализовано (есть пока несколько движков, действующих солидно). Кода, который реализует это, нигде ты не найдёшь. Зато может попадётся код, использующий какую-либо библиотеку. Так что ищи.


 
Ianus ©   (2004-01-18 13:44) [3]

Черт, опять неправильно выразился...
Всмысле не распознать речь, а просто поанализировать на совпадение двух звуковых файлов... Так, как я понимаю, реализуется голосовой набор в мобильных телефонах - ты записываешь метку голосовую - сопоставляешь ее с номером телефона, потом произносишь её, телефон находит подобную запись и набирает номер... Ух...


 
Mihey ©   (2004-01-18 19:32) [4]

Это по тембру голоса.


 
Aleksey ©   (2004-01-19 10:52) [5]

Попробуй сравнивать размер, длину, частоту, битрейд...


 
Brahman ©   (2004-01-19 10:57) [6]

Фильтр линейного предсказания
CELP-модель
Кодек G.729

Если это не отобьет охоту, то поздравляю.


 
Ianus ©   (2004-01-19 20:18) [7]

а по русски ? :)
---
Мож сылочку какую дадите?.. или кодик какой-ить там? ;)


 
Yr2   (2004-01-19 23:00) [8]

а Вы сначала детально посмотрите на графическое представление речи. Программы работы со звуком есть, например здесь:
http://www.blazeaudio.com/?app=wst
http://www.dsp.sut.ru/edsw/index.html


 
Ianus ©   (2004-01-20 20:17) [9]

ммм... да! Thanks... Сейчас поспосмотрим



Страницы: 1 вся ветка

Текущий архив: 2004.04.25;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.025 c
4-1077103467
SelfDestructor
2004-02-18 14:24
2004.04.25
IShellLink не опознается


3-1080539971
Orc
2004-03-29 09:59
2004.04.25
Лист Excel


3-1080663041
incm
2004-03-30 20:10
2004.04.25
Проблема Table Language


1-1081345221
Переяслов Григорий
2004-04-07 17:40
2004.04.25
Меню с кнопкой закрытия документа


8-1074944902
_MAD_
2004-01-24 14:48
2004.04.25
работа с bmp