Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Media";
Текущий архив: 2007.03.18;
Скачать: [xml.tar.bz2];

Вниз

Упаковка звука.   Найти похожие ветки 

 
@!!ex ©   (2006-07-16 00:47) [0]

Итак. Собственно сабж. ничего по теме не нашел.
Правда искал только здесь, поскольку времени совсем нету. :(
Беру данные из буффера DirectSound.
Нужно запаковать, чтобы не слишком много трафа жрало и с учетом того, что звук - человеческий голос.
Как? Какие есть алгоритмы?
Компоненты не предлагать. Хотя.....


 
grouzd)ev ©   (2006-07-16 01:09) [1]


> Какие есть алгоритмы?

простите, но по слову "алгоритм" мой разум сам печатает "алголист" http://algolist.manual.ru/compress/audio/index.php ибо на нем есть все =)

---
... we are walking on a thin line and you better avoid the risk ...


 
@!!ex ©   (2006-07-16 16:34) [2]

Отличный сайт! Добавил себе в избранное.
Но........ Моего английского не хватает, чтобы понять что там написано....
Все еще усложняется тем, что со звком я работаю впервые.


 
Pavia ©   (2006-07-16 17:14) [3]

Воспользуйся кодэком H.264 или любым другим из его семейства. он специально разработан для сжатия речи.


 
@!!ex ©   (2006-07-16 22:42) [4]

Ничего по сжатию потока звука не нашел... :\
По использованию H.264 тоже ничего не нашел.
Решил сжимать без потери качества с помощью LZW.
В принципе получаеться 5кбайт/сек. При 12000 khz.
Нормально. GPRS потянет.


 
Cash ©   (2006-07-16 23:55) [5]

Стандартный алгоритм запаковки для передачи по сети -- это код Хаффмана.
В данном случае используют адаптивный на окне. Еще в определенных
случаях юзают модифицырованный код, но это ваще дебри, там рабираловки
лет на десять хватит. А так оконный адаптивный Хаффман -- это куль!


 
Asteroid ©   (2006-07-18 03:39) [6]

> Cash ©   (16.07.06 23:55) [5]
Тут вообще-то про сжатие именно человеческой речи, и особености ее построения учитываются в кодеках.

> @!!ex ©   (16.07.06 22:42) [4]
Попробуй хранить не абсолютное значение каждого сэмпла, а его смещение относительно предыдущего, исходный поток ужмется раза в два-четыре (а-ля ADPCM). Не знаю, как повлияет на результат сжатие LZW, но думаю, что размер конечного потока не увеличится :)


 
Cash ©   (2006-07-18 09:32) [7]

Asteroid ©   (18.07.06 03:39) [6]:
А в кодеках зачастую, вроде, берут LZ модификации, в частности LZW и
LZH. Очень хорошие методы для сжатия без потерь.

В принципе @!!ex правильно сделал, теперь если надо будет еще немного
обжать, то достаточно будет подписать кодер-декодер для Хаффмана и
у него получится почти LZHW.


 
@!!ex ©   (2006-07-18 10:27) [8]

Asteroid ©
Не знаю, как повлияет на результат сжатие LZW, но думаю, что размер конечного потока не увеличится :)

Сжимаеться примерно в полтора раза.

Cash ©   (16.07.06 23:55) [5]
Стандартный алгоритм запаковки для передачи по сети -- это код Хаффмана.
В данном случае используют адаптивный на окне. Еще в определенных
случаях юзают модифицырованный код, но это ваще дебри, там рабираловки
лет на десять хватит. А так оконный адаптивный Хаффман -- это куль!

А поподробнее мона? В инете куча левой инфы, а самого принципа нету.


 
Eraser ©   (2006-07-18 19:06) [9]

> [8] @!!ex ©   (18.07.06 10:27)

я бы использовал zlib, тем более в последней версии настроек сжатия больше появилось. А по скорости с zlib тягаться бесполезно.


 
Cash ©   (2006-07-18 20:55) [10]

@!!ex ©   (18.07.06 10:27) [8]:
Мне Хаффмана в универе два с половиной раза давали, один --
на курсе САОДа (шкодинг, писал статический, адаптивный), а другой --
на курсе Сетей ЭВМ (чес-слово, ни чем от оконного не отличается,
хотя преподша нас убеждала в обратном... :) ).

Линк на Хаффмана у тебя есть, на теорию то есть, это самый первый пост
(grouzd)ev опередил).
А на исходники я чего то потерял линк, но если что то я его выложу.

(просто объяснять малость не охота, у меня мозга работать не хочет, устал
после дачи как зараза... :))


 
AlexRush ©   (2006-07-19 17:11) [11]

Я использовал в свое время ADPCM +Хафмана. Но по GPRS это вытянет вряд ли. Порой еще на тему VOX и GSM кодеков поискать. А еще можно глянуть, чем Skype пользуется.


 
Pavia ©   (2006-07-19 19:43) [12]

Извеняюсь попутал названия, я их всегда путаю.
Для звука применяют следующие кодэки.
G.711,G.722,G.728,G.723,G.729 это для звука
А H.261,H.263,H.264 это видео.
А для извращенцев могу предложить дискретное конисусное преобразование.



Страницы: 1 вся ветка

Форум: "Media";
Текущий архив: 2007.03.18;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.47 MB
Время: 0.039 c
2-1172274829
koha
2007-02-24 02:53
2007.03.18
Клик мышью в TListView


15-1172292597
Demon__
2007-02-24 07:49
2007.03.18
помогите найти


1-1169200915
Delphi-Chainik
2007-01-19 13:01
2007.03.18
Тип запуска у службы


3-1166562249
Dmytro
2006-12-20 00:04
2007.03.18
Как переписать данный запрос?


2-1172510528
Lonix
2007-02-26 20:22
2007.03.18
Почему выдает ошибку....





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский