Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Media";
Текущий архив: 2002.09.12;
Скачать: [xml.tar.bz2];

Вниз

Анализ WAV - файла   Найти похожие ветки 

 
Doom   (2002-03-21 12:21) [0]

Извините за вопрос, который многим может показаться ламерсим. У меня есть WAV файл оцифрованный скажем в моно 8 kHz (записанный с модема ответ автоответчика) Необходимо по временным интервалам тишины определить, что говорил автоответчик (То есть отличить что-то вроде "Никого нет дома" от "Не могу подойти к телефону"). Как проанализировать? Может дадите ссылочку в инете где документацию по WAV искать. А может кто подобным уже страдал.... А то темный лес для меня это.


 
Digitman   (2002-03-21 15:33) [1]

Забудь на время про WAV, поскольку это - не более чем один из контейнерных форматов для хранения на носителе оцифрованного аудиосигнала.

А займись-ка прежде всего изучением алгоритмов линейного анализа/синтеза речи. Уверен - это как раз то, что нужно в твоем случае.


 
Doom   (2002-03-21 18:40) [2]

Спасибо. Но тогда может посоветуете переконвертить WAV в какой-нибудь удобочитаемый формат? Если да, то в какой?
Например, что бы там данные амплитуды шли массивом - это будет как раз то что я ищу.
Потому что в моем случае нужно найти в данных всего лишь временные интервалы тишины.


 
Digitman   (2002-03-22 11:09) [3]

в WAV (конкретно - PCM-формата) данные так и идут "парами", выборка за выборкой : амплитуда выборки лев.канала, амрлитуда выборки прав.канала .. уж проще и "удобочитаемей", чем PCM, не придумаешь)... только не забудь про заголовок, предваряющий данные


 
RF_Vital   (2002-05-14 22:06) [4]

Здравствуйте. Извиняюсь, что вмешиваюсь, но я столкнулся с такой же проблемой ( или похожей). Может быть чего-нибудь посоветуете. С Делфи только-только начал разбираться, поэтому можно считать меня полным чайником. В общем перейду к сути. Мне необходимо разобрать данные из wav-файла, а конкретнее - посчитать частоту пересечения с осью времени и степень нарастания амплитуды...
Заранее спасибо.



Страницы: 1 вся ветка

Форум: "Media";
Текущий архив: 2002.09.12;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.45 MB
Время: 0.007 c
8-35819
limon
2002-05-07 18:47
2002.09.12
Разворот изображения


3-35575
AndbyOne
2002-08-22 10:19
2002.09.12
SQL запросик


1-35732
Dimushkin
2002-08-30 12:52
2002.09.12
Clipboard...


14-35908
Song
2002-08-19 22:25
2002.09.12
Проблема: КАК может частное лицо продать своё ПО юр. лицу,


1-35810
Mazenrat
2002-08-31 16:01
2002.09.12
Проблема с Transparent := True;





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский