sciff:Получается, та же картина, что и с моно, будет и со стерео звуком, имеющим сильно различающиеся каналы :?:
А как насчет 6-канального звука? Каналы тоже кодируются в зависимости друг от друга? И насколько качественно отточен алгоритм?
При качестве от q5 включительно все каналы кодируются независимо друг от друга. До этого — смешивание каналов используется, и это 100% оправдано на любом стерео потоке, т.к. оба канала всегда связаны. Другая ситуация — когда в одном канале речь на английском, в другом — на русском, и оба эти канала не будут звучать одновременно. Здесь уже необходимо использовать обычное стерео кодирование. Смешивание каналов позволяет повысить качество общего потока за счет того, что если оба канала будут всегда прослушиваться одновременно — их можно кодировать с учетом этого.
sciff:P.S. Слышал, что в версии кодека 2.0 (Vorbis II) будет применяться волновое (wavelet) кодирование, известны какие нибудь подробности (не очень понимаю что имеется ввиду :D ) ?
MP3, Ogg Vorbis, WMA, WMA Pro, AAC, VQF и т.д. — все эти форматы используют общие идеи, и основаны на алгоритмах MDCT и FFT. В MP3 подошли к их реализации «в лоб». Для 1994 года это и так было не так плохо. В MDCT имеется очень важный минус, из-за которого у MP3 и большинства других форматов (WMA, AAC) нет поддержки gapeless — каждый обрабатываемый при помощи MDCT фрагмент должен начинаться и заканчиваться тишиной, иначе может появляться очень неприятный «щелчек». Именно поэтому в начале или конце MP3 и WMA файлов автоматом добавляется тишина. Между фреймами на самом деле тоже имеются «обнуленные» семплы, но при помощи элементарного перехода волны из фрейма в фрейм при частоте 44100 это не ощущается, хотя влияет на ухудшение качества звука, т.к. переход от фрейма к фрейму синтезируется искусственно.
В Ogg Vorbis разработчики решили проблему весьма простым и весьма оригинальным путем. В каждый фрейм в начало и конец кодируется несколько лишних семплов из предыдущего и следующего фрейма, а при воспроизведении каждый фрейм немного «наползает» друг на друга. Отсюда и gapeless на уровне формата, и лучшее качество.
В действительности — Vorbis I — это наиболее качественная реализация идей MDCT и FFT. Лучше уже некуда. Изменение психоаккустики — без проблем. Все кодовые книги, которыми кодировался файл, сохраняются в самом файле в третьем фрейме, и используются при декодировании. А это значит, что в кодерах можно изменять психоаккустику, и полученный файл проиграется стандартным декодером.
Vorbis II будет форматом иного класса — wavelet. Идеи wavelet уже были применены в JPEG2000, но аудио-кодеков такого типа до сих пор не существует, исследований проведено еще очень мало... Психоаккустика для кодирования звука wavelet алгоритмом абсолютно другая, поэтому большинство наработок из области MDCT не подходят, и все исследуется с нуля. Главный плюс данного подхода — файл может кодироваться целиком, а не по маленьким фрагментам, в итоге при понижении битрейта вместо появления артефактов просто будут пропадать некоторые тонкости звука. Оценить разницу можно при сравнении тех же JPEG (использует MDCT) и JPEG2000 (wavelet).