Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2008.07.20;
Скачать: CL | DM;

Вниз

Степень "похожести" двух аудио фрагментов   Найти похожие ветки 

 
разведчик   (2007-07-03 13:50) [0]

Какие технологии/алгоритмы используются для решения подобной задачи?


 
Jeer ©   (2007-07-03 15:43) [1]

- спектральный (фурье или вейвлет) анализ и/или корреляционные методы


 
Сергей М. ©   (2007-07-03 16:04) [2]


> разведчик   (03.07.07 13:50)


Дай четкое определение термину "похожесть"..


 
разведчик   (2007-07-03 16:24) [3]

Есть локальный аудио образец. И есть эфир.
Надо считать количество прогонов образца в эфире.


 
Jeer ©   (2007-07-03 16:27) [4]


> Сергей М. ©   (03.07.07 16:04) [2]


Твой вопрос вообще вне конкурса - найти два муз.фрагмента, похожих по смысловому содержанию воспроизводимого, причем один должен быть в стиле рэп, а другой - римейк на тему "Лунная соната".


 
Jeer ©   (2007-07-03 16:28) [5]


> разведчик   (03.07.07 16:24) [3]


Если фрагмент точно из муз.произведения - можно.


 
Сергей М. ©   (2007-07-03 16:30) [6]

А этот "образец" в эфире "прогоняется" без какой-либо обработки ?

Я имею ввиду, к примеру, "растяжку/сжатие" шкалы реального времени воспроизведения и/или пич-бэнд ...


 
Сергей М. ©   (2007-07-03 16:31) [7]


> Jeer ©   (03.07.07 16:27) [4]


Не, Серег)

Я не о том.

см. [6]


 
разведчик   (2007-07-03 16:35) [8]

Образец эталонный. Всегда есть.
Его гоняют в эфире без какой-либо обработки.
Нужно просто определять в аудио потоке его наличие.
Ну то есть считать.
Образец представляет собой речь, но может быть на фоне музона


 
Jeer ©   (2007-07-03 16:40) [9]


> Сергей М. ©   (03.07.07 16:31) [7]
>
>


Да понятно, что наличие преднамеренных искажений шкалы времени, мультипликативных и/или аддитивных искажений значительно затруднит распознавание.


 
разведчик   (2007-07-03 16:43) [10]

Если фрагмент точно из муз.произведения - можно.

Собственно и хотелось бы получить подсказку или направление для поиска


 
Jeer ©   (2007-07-03 16:44) [11]


> разведчик   (03.07.07 16:43) [10]


См. [1]


 
разведчик   (2007-07-03 16:47) [12]

То есть я так понял, что если это будет только речь (а там спектр невнятный) то все будет довольно проблематично?


 
@!!ex ©   (2007-07-03 16:55) [13]

Тут уже обсуждался этот вопрос. Где то пол годика годик назад. Ищи.
Дай все исходные данные задачи, тогд аможно будет облегчить алгоритм проверки.
Например сравнить два сигнала одинаковой длины, с полным соответствием тайминга волн - не проблема вообще.


 
Jeer ©   (2007-07-03 17:05) [14]


> разведчик   (03.07.07 16:47) [12]


Не только спектр тембра - для речи можно выделять темп произнесения.
По сути это нижний спектр модуляции - полоса в районе долей - единиц герц.


 
разведчик   (2007-07-03 17:17) [15]

Все исходные данные я уже описал. Что за образец будет конкретно сейчас неизвестно. Длительность примерно около минуты. Речь в нем будет стопроцентно.


 
@!!ex ©   (2007-07-03 17:49) [16]

ОТносительно простой способ, работающий, если трэк не искажен, не изменен, и уровень шума не большой.
Берешь исходный трэк. Из него берешь некоторый кусок.(Не вижу смысла проверять всесь трэк)
Делишь его на кучу небольших кусков.
В процессе прослушиваняи эфира сравниваешь все с самым первым куском(тупо сравнение волны с некоторой точностью), как только кусок прошел тест, выделяешь потом в котором проверяешь второй, и так далее пока не будет проверен весь трэк. Если на каком то куске проверка обломилась, поток деактивируется.
понятно что одновременно могут существовать несколько потоков, а при спцифической однообразности музыки современной и неудачно подобранном куске для проверки может количество потоков размножится до сотен.
Если еще проверять не один трэк, а несколько.. Супердум на 30 процов справится, :))
Все приведенное выше не проверенно на практике, чисто теоретические соображения, но я немного занимался сравнением звуковых потоков, поэтому это все же соображения основанные на некотором опыте, хоть и не большом.


 
разведчик   (2007-07-03 18:13) [17]

Ну и тогда самое интересное:
А что за библиотеки для этого "сравнения волн" использовать?


 
Jeer ©   (2007-07-03 18:19) [18]


> Если на каком то куске проверка обломилась, поток деактивируется.

Ну да - эфирный треск, например.

Простейший способ:
-прогнать трэк через soundforge и определиться с нижней частью спектра
-прогнать наиболее характерный отрывок через ФНЧ и получить эталонный сигнал

Далее, гнать входной поток через такой же ФНЧ и считать корреляцию.


 
@!!ex ©   (2007-07-03 18:49) [19]

> Ну да - эфирный треск, например.

Это уже от выбранного метода сравнения зависит и точности.

I>
> А что за библиотеки для этого "сравнения волн" использовать?

Хм. Напиши, да используй? Ктож за тебя писать будет?


 
Jeer ©   (2007-07-04 10:01) [20]


> @!!ex ©   (03.07.07 18:49) [19]
>
> > Ну да - эфирный треск, например.


> Это уже от выбранного метода сравнения зависит и точности.
>
>


И при чем тут голова ?


 
@!!ex ©   (2007-07-04 10:59) [21]

> [20] Jeer ©   (04.07.07 10:01)

Метод настроенный на то, что в эфире может быть треск, его нормально обработают, что непонятного то?


 
Jeer ©   (2007-07-04 11:51) [22]


> Метод настроенный на то


Надеюсь ты понимаешь, что произнеся слово "метод" ты не внес никакой информативности ?


 
@!!ex ©   (2007-07-04 12:17) [23]

> [22] Jeer ©   (04.07.07 11:51)

Конечно понимаю. Методов вагонами. Об этом я и говорю.
Однако в посте [18] тебе было достаточно информации чтобы сделать вывод:

> Ну да - эфирный треск, например


При том, что метод я опять же не укаызвал.


 
Jeer ©   (2007-07-04 13:21) [24]


> @!!ex ©   (04.07.07 12:17) [23]


> тебе было достаточно информации чтобы сделать вывод


Конечно достаточно, т.к. можно предположить наличие мешающих факторов, но если не определен (не озвучен) один из методов их устранения, можно долго-долго говорить "халва".

В том же [18] как раз и приведен мной один из методов, вполне поддающийся алгоритмизации.

В твоем же случае [16] приведена некоторая абстрактная последовательность действий, не имеющая каких-либо видимых обоснований, что она будет работать, за что тобой и получено по шее:))



Страницы: 1 вся ветка

Текущий архив: 2008.07.20;
Скачать: CL | DM;

Наверх




Память: 0.53 MB
Время: 0.022 c
15-1211909818
best-serg
2008-05-27 21:36
2008.07.20
Таблица Paradox и установка программы на новый пк


3-1202764635
alexnmsk
2008-02-12 00:17
2008.07.20
Хранимая процедура


15-1212562601
БарЛог
2008-06-04 10:56
2008.07.20
И еще раз о корзине в магазине...


2-1213898401
ProofNA
2008-06-19 22:00
2008.07.20
Работа с принтером


2-1213690361
lewka-serdceed
2008-06-17 12:12
2008.07.20
переименование файла