cranium » 03.05.2007, 14:54
Черт, возникла небольшая проблемка, может есть у кого что мне нужно, буду очень признателен. А требуется общая схема кодера Ogg Vorbis.
И вот еще, пока переводил документацию по Ogg Vorbis возникло пару вопросов. Много где читаю, что MPEG-1 Layer III и Ogg Vorbis очень отличаются в плане алгоритмов, особенно психоакустическими моделями. Тогда что считать такой моделью? Аппроксимацию т.н. абсолютного порога слышимости (ATH)? Или имеется ввиду алгоритм обработки сигнала в соответствии со свойствами слуха? Или же это учет ATH + различных эффектов маскировки (временных, частотных, пространственных) И там и там используются взвешивающие окна переменной длины, но разной формы(!). И ам и там используется VBR для улучшения обработки мест где имеются резкие скачки (но в МP3 это наз-ся "псевдо" VBR, из-за резервуара с выдел. битами для кодирования). И там и там исп-ся MDCT и IMDCT, в Ogg Vorbis есть предпосылки в качестве ортогонального перобразования использовать ДВП (дискр. вейвлет преобразование) или гибридный кодер с ДВП и ДКП-подобных преобразований. В MP3 не видел, чтобы применялось векторное квантование (VQ).
К тому же в Ogg Vorbis имеются такие понятия как Floor и Residue, я точно не знаю пока, но предполагаю что это как-то связано с VQ. Т.е. отдельно кодируется передается в отдельных секциях информация о НЧ-составляющей сигнала (сигнал floor) и информация о ВЧ-насадке (residues). Затем они распаковываются (декоируются) складываются и получается что-то вроде спектального отображения сигнала. Ну и затем к этой сумме применяется обратное MDCT (возможно с какой-нить фильтрацией и коррекцией.)
Спрашивал у доцента нашей кафедры, по каким критериям мона срвнивать эти форматы. Он говорит, что только на слух мона субъективно оценить. Скорее всего так, обидно...
У меня была мысль (и еще остается), не обращая внимания на процессы, которые происходят в кодеке просто сравнить входной и выходной сигналы (в частотной или временной областях) при различных параметрах кодирования. Обрабатывая отсчеты сигнала, взятые с audio-CD сначала одним кодеком, затем вторым. Каким параметром (математическим) можно охарактеризовать такое сравнение (степень различия напр.)? Мне ничего в голову не приходит, кроме как коэффициента корреляции. И, может, для сравнения взять какой-нить отрывок на пару секунд где слышны резкие звуки? Ведь насколько я понял основная проблема кодеков состоит в правильности передачи таких вот "сложных" моментов.