Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2007.03.18;
Скачать: CL | DM;

Вниз

Упаковка звука.   Найти похожие ветки 

 
@!!ex ©   (2006-07-16 00:47) [0]

Итак. Собственно сабж. ничего по теме не нашел.
Правда искал только здесь, поскольку времени совсем нету. :(
Беру данные из буффера DirectSound.
Нужно запаковать, чтобы не слишком много трафа жрало и с учетом того, что звук - человеческий голос.
Как? Какие есть алгоритмы?
Компоненты не предлагать. Хотя.....


 
grouzd)ev ©   (2006-07-16 01:09) [1]


> Какие есть алгоритмы?

простите, но по слову "алгоритм" мой разум сам печатает "алголист" http://algolist.manual.ru/compress/audio/index.php ибо на нем есть все =)

---
... we are walking on a thin line and you better avoid the risk ...


 
@!!ex ©   (2006-07-16 16:34) [2]

Отличный сайт! Добавил себе в избранное.
Но........ Моего английского не хватает, чтобы понять что там написано....
Все еще усложняется тем, что со звком я работаю впервые.


 
Pavia ©   (2006-07-16 17:14) [3]

Воспользуйся кодэком H.264 или любым другим из его семейства. он специально разработан для сжатия речи.


 
@!!ex ©   (2006-07-16 22:42) [4]

Ничего по сжатию потока звука не нашел... :\
По использованию H.264 тоже ничего не нашел.
Решил сжимать без потери качества с помощью LZW.
В принципе получаеться 5кбайт/сек. При 12000 khz.
Нормально. GPRS потянет.


 
Cash ©   (2006-07-16 23:55) [5]

Стандартный алгоритм запаковки для передачи по сети -- это код Хаффмана.
В данном случае используют адаптивный на окне. Еще в определенных
случаях юзают модифицырованный код, но это ваще дебри, там рабираловки
лет на десять хватит. А так оконный адаптивный Хаффман -- это куль!


 
Asteroid ©   (2006-07-18 03:39) [6]

> Cash ©   (16.07.06 23:55) [5]
Тут вообще-то про сжатие именно человеческой речи, и особености ее построения учитываются в кодеках.

> @!!ex ©   (16.07.06 22:42) [4]
Попробуй хранить не абсолютное значение каждого сэмпла, а его смещение относительно предыдущего, исходный поток ужмется раза в два-четыре (а-ля ADPCM). Не знаю, как повлияет на результат сжатие LZW, но думаю, что размер конечного потока не увеличится :)


 
Cash ©   (2006-07-18 09:32) [7]

Asteroid ©   (18.07.06 03:39) [6]:
А в кодеках зачастую, вроде, берут LZ модификации, в частности LZW и
LZH. Очень хорошие методы для сжатия без потерь.

В принципе @!!ex правильно сделал, теперь если надо будет еще немного
обжать, то достаточно будет подписать кодер-декодер для Хаффмана и
у него получится почти LZHW.


 
@!!ex ©   (2006-07-18 10:27) [8]

Asteroid ©
Не знаю, как повлияет на результат сжатие LZW, но думаю, что размер конечного потока не увеличится :)

Сжимаеться примерно в полтора раза.

Cash ©   (16.07.06 23:55) [5]
Стандартный алгоритм запаковки для передачи по сети -- это код Хаффмана.
В данном случае используют адаптивный на окне. Еще в определенных
случаях юзают модифицырованный код, но это ваще дебри, там рабираловки
лет на десять хватит. А так оконный адаптивный Хаффман -- это куль!

А поподробнее мона? В инете куча левой инфы, а самого принципа нету.


 
Eraser ©   (2006-07-18 19:06) [9]

> [8] @!!ex ©   (18.07.06 10:27)

я бы использовал zlib, тем более в последней версии настроек сжатия больше появилось. А по скорости с zlib тягаться бесполезно.


 
Cash ©   (2006-07-18 20:55) [10]

@!!ex ©   (18.07.06 10:27) [8]:
Мне Хаффмана в универе два с половиной раза давали, один --
на курсе САОДа (шкодинг, писал статический, адаптивный), а другой --
на курсе Сетей ЭВМ (чес-слово, ни чем от оконного не отличается,
хотя преподша нас убеждала в обратном... :) ).

Линк на Хаффмана у тебя есть, на теорию то есть, это самый первый пост
(grouzd)ev опередил).
А на исходники я чего то потерял линк, но если что то я его выложу.

(просто объяснять малость не охота, у меня мозга работать не хочет, устал
после дачи как зараза... :))


 
AlexRush ©   (2006-07-19 17:11) [11]

Я использовал в свое время ADPCM +Хафмана. Но по GPRS это вытянет вряд ли. Порой еще на тему VOX и GSM кодеков поискать. А еще можно глянуть, чем Skype пользуется.


 
Pavia ©   (2006-07-19 19:43) [12]

Извеняюсь попутал названия, я их всегда путаю.
Для звука применяют следующие кодэки.
G.711,G.722,G.728,G.723,G.729 это для звука
А H.261,H.263,H.264 это видео.
А для извращенцев могу предложить дискретное конисусное преобразование.



Страницы: 1 вся ветка

Текущий архив: 2007.03.18;
Скачать: CL | DM;

Наверх




Память: 0.49 MB
Время: 0.06 c
3-1166435221
mezozoy
2006-12-18 12:47
2007.03.18
структура базы данных


2-1172660999
МегаПупс
2007-02-28 14:09
2007.03.18
Курсор


15-1171978977
Ega23
2007-02-20 16:42
2007.03.18
А куда в Delphi7 делся QuickReport?


2-1172232151
deras
2007-02-23 15:02
2007.03.18
Цветной DBGrid


15-1171660987
Ricks
2007-02-17 00:23
2007.03.18
Никола Тесла