Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Media";
Текущий архив: 2008.07.20;
Скачать: [xml.tar.bz2];

Вниз

Степень "похожести" двух аудио фрагментов   Найти похожие ветки 

 
разведчик   (2007-07-03 13:50) [0]

Какие технологии/алгоритмы используются для решения подобной задачи?


 
Jeer ©   (2007-07-03 15:43) [1]

- спектральный (фурье или вейвлет) анализ и/или корреляционные методы


 
Сергей М. ©   (2007-07-03 16:04) [2]


> разведчик   (03.07.07 13:50)


Дай четкое определение термину "похожесть"..


 
разведчик   (2007-07-03 16:24) [3]

Есть локальный аудио образец. И есть эфир.
Надо считать количество прогонов образца в эфире.


 
Jeer ©   (2007-07-03 16:27) [4]


> Сергей М. ©   (03.07.07 16:04) [2]


Твой вопрос вообще вне конкурса - найти два муз.фрагмента, похожих по смысловому содержанию воспроизводимого, причем один должен быть в стиле рэп, а другой - римейк на тему "Лунная соната".


 
Jeer ©   (2007-07-03 16:28) [5]


> разведчик   (03.07.07 16:24) [3]


Если фрагмент точно из муз.произведения - можно.


 
Сергей М. ©   (2007-07-03 16:30) [6]

А этот "образец" в эфире "прогоняется" без какой-либо обработки ?

Я имею ввиду, к примеру, "растяжку/сжатие" шкалы реального времени воспроизведения и/или пич-бэнд ...


 
Сергей М. ©   (2007-07-03 16:31) [7]


> Jeer ©   (03.07.07 16:27) [4]


Не, Серег)

Я не о том.

см. [6]


 
разведчик   (2007-07-03 16:35) [8]

Образец эталонный. Всегда есть.
Его гоняют в эфире без какой-либо обработки.
Нужно просто определять в аудио потоке его наличие.
Ну то есть считать.
Образец представляет собой речь, но может быть на фоне музона


 
Jeer ©   (2007-07-03 16:40) [9]


> Сергей М. ©   (03.07.07 16:31) [7]
>
>


Да понятно, что наличие преднамеренных искажений шкалы времени, мультипликативных и/или аддитивных искажений значительно затруднит распознавание.


 
разведчик   (2007-07-03 16:43) [10]

Если фрагмент точно из муз.произведения - можно.

Собственно и хотелось бы получить подсказку или направление для поиска


 
Jeer ©   (2007-07-03 16:44) [11]


> разведчик   (03.07.07 16:43) [10]


См. [1]


 
разведчик   (2007-07-03 16:47) [12]

То есть я так понял, что если это будет только речь (а там спектр невнятный) то все будет довольно проблематично?


 
@!!ex ©   (2007-07-03 16:55) [13]

Тут уже обсуждался этот вопрос. Где то пол годика годик назад. Ищи.
Дай все исходные данные задачи, тогд аможно будет облегчить алгоритм проверки.
Например сравнить два сигнала одинаковой длины, с полным соответствием тайминга волн - не проблема вообще.


 
Jeer ©   (2007-07-03 17:05) [14]


> разведчик   (03.07.07 16:47) [12]


Не только спектр тембра - для речи можно выделять темп произнесения.
По сути это нижний спектр модуляции - полоса в районе долей - единиц герц.


 
разведчик   (2007-07-03 17:17) [15]

Все исходные данные я уже описал. Что за образец будет конкретно сейчас неизвестно. Длительность примерно около минуты. Речь в нем будет стопроцентно.


 
@!!ex ©   (2007-07-03 17:49) [16]

ОТносительно простой способ, работающий, если трэк не искажен, не изменен, и уровень шума не большой.
Берешь исходный трэк. Из него берешь некоторый кусок.(Не вижу смысла проверять всесь трэк)
Делишь его на кучу небольших кусков.
В процессе прослушиваняи эфира сравниваешь все с самым первым куском(тупо сравнение волны с некоторой точностью), как только кусок прошел тест, выделяешь потом в котором проверяешь второй, и так далее пока не будет проверен весь трэк. Если на каком то куске проверка обломилась, поток деактивируется.
понятно что одновременно могут существовать несколько потоков, а при спцифической однообразности музыки современной и неудачно подобранном куске для проверки может количество потоков размножится до сотен.
Если еще проверять не один трэк, а несколько.. Супердум на 30 процов справится, :))
Все приведенное выше не проверенно на практике, чисто теоретические соображения, но я немного занимался сравнением звуковых потоков, поэтому это все же соображения основанные на некотором опыте, хоть и не большом.


 
разведчик   (2007-07-03 18:13) [17]

Ну и тогда самое интересное:
А что за библиотеки для этого "сравнения волн" использовать?


 
Jeer ©   (2007-07-03 18:19) [18]


> Если на каком то куске проверка обломилась, поток деактивируется.

Ну да - эфирный треск, например.

Простейший способ:
-прогнать трэк через soundforge и определиться с нижней частью спектра
-прогнать наиболее характерный отрывок через ФНЧ и получить эталонный сигнал

Далее, гнать входной поток через такой же ФНЧ и считать корреляцию.


 
@!!ex ©   (2007-07-03 18:49) [19]

> Ну да - эфирный треск, например.

Это уже от выбранного метода сравнения зависит и точности.

I>
> А что за библиотеки для этого "сравнения волн" использовать?

Хм. Напиши, да используй? Ктож за тебя писать будет?


 
Jeer ©   (2007-07-04 10:01) [20]


> @!!ex ©   (03.07.07 18:49) [19]
>
> > Ну да - эфирный треск, например.


> Это уже от выбранного метода сравнения зависит и точности.
>
>


И при чем тут голова ?


 
@!!ex ©   (2007-07-04 10:59) [21]

> [20] Jeer ©   (04.07.07 10:01)

Метод настроенный на то, что в эфире может быть треск, его нормально обработают, что непонятного то?


 
Jeer ©   (2007-07-04 11:51) [22]


> Метод настроенный на то


Надеюсь ты понимаешь, что произнеся слово "метод" ты не внес никакой информативности ?


 
@!!ex ©   (2007-07-04 12:17) [23]

> [22] Jeer ©   (04.07.07 11:51)

Конечно понимаю. Методов вагонами. Об этом я и говорю.
Однако в посте [18] тебе было достаточно информации чтобы сделать вывод:

> Ну да - эфирный треск, например


При том, что метод я опять же не укаызвал.


 
Jeer ©   (2007-07-04 13:21) [24]


> @!!ex ©   (04.07.07 12:17) [23]


> тебе было достаточно информации чтобы сделать вывод


Конечно достаточно, т.к. можно предположить наличие мешающих факторов, но если не определен (не озвучен) один из методов их устранения, можно долго-долго говорить "халва".

В том же [18] как раз и приведен мной один из методов, вполне поддающийся алгоритмизации.

В твоем же случае [16] приведена некоторая абстрактная последовательность действий, не имеющая каких-либо видимых обоснований, что она будет работать, за что тобой и получено по шее:))



Страницы: 1 вся ветка

Форум: "Media";
Текущий архив: 2008.07.20;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.5 MB
Время: 0.048 c
2-1213873717
ciborg
2008-06-19 15:08
2008.07.20
Как скопировать объект


15-1212413751
Alkid
2008-06-02 17:35
2008.07.20
Хороший киберпанк.


11-1191870302
LazyBob
2007-10-08 23:05
2008.07.20
List View непойму никак..


2-1214211036
Джоник__
2008-06-23 12:50
2008.07.20
Панели быстрого запуска


2-1213686010
webpauk
2008-06-17 11:00
2008.07.20
Найти MDI





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский