saboteur » 19.01.2006, 08:38
Привет, друзья! Мне 30 лет, я звукоинженер, живу в городе Ростове-на-Дону. Очень рад, что теперь и у нас появился полноценный сайт, посвящённый формату Ogg Vorbis, на котором я с удовольствием зарегестрировался. К идее выбора альтернативных кодеков пришёл пару лет назад по совету своего друга и коллеги. Он рекомендовал мне Ogg Vorbis. Самым свежим кодировщиком в то время был - GT3b2. Когда я услышал результаты кодирования, я был поражён. Так, как я имею большую коллекцию сжатой музыки, которую постоянно пополняю, для меня вопрос сжатия звука значит очень много - я имею огромный архив музыки 50-х, 60-х и 70-х годов. Когда я "подсел" на Ogg Vorbis и стал сжимать только им, я в какой-то момент обнаружил, что заразился болезнью качества кодирования и выбора форматов (барьер был сломан). Я с огромным интересом гулял по просторам сети, выискивая всё новые и новые альтернативные mp3 варианты сжатия звука, читал статьи, качал кодировщики, ставил экперименты по качеству, сжимая звук так и эдак... Что для меня значит свобода формата..... ПОЧТИ ВСЁ.... Вот вам поучительная история: Скачав, и сравнив всевозможные варианты кодировщиков, я понял, что самым качественным кодировщиком из всех является - LQT из семейста MPEG4 AAC. При битрейте 192 kbps он полностью повторяет качество CDA на промежутке от 20 до 20 000 герц (это показали не только слепые, но и програмные тесты). Он также сохраняет целостность фреймов и не разрушает временную целостность файлов и альбомов... Что же далее... Я начал искать к нему полный набор програмного обеспечения, чтобы укомплектовать нужный мне набор для перехода на новый формат - собственно сам кодировщик, раскодировщик, плеер, редактор тэгов и по возможности другие дополнительные утилиты, как то - windows консоли, редакторы без раскодирования и т. д.... А вот теперь и проблемы открытости формата - более закрытого формата свет, наверное, не видал... Я столкнулся с проблемой уже в поисках раскодировщика - его просто не существует... - бесплатно, во всяком случае.... Был вариант замены плеера его экспресс версией, в которой, якобы, появлялась функция декодирования файлов LQT. Всё так.... кроме того, что функция эта не работала корректно и декодировала лишь начало трэка... то есть только несколько секунд звучания, видимо просто для ознакомления.... Оставался ещё только один последний вариант - утилита Total Recorder, которая способна напрямую записывать любой воспроизводимый звук на PC в WAV PCM файлы. Но при такой декодировке невозможно было сохранить временную целостность файлов, так как эта програма не способна чётко определять начало и конец оригинального материала.... Так что пришлось отказаться от идеи использования формата LQT, хотя досадно было жуть как! Вот вам и вопрос открытости формата..... Ogg Vorbis занимал второе место по соотношению качество/размер (а по гибкости, доступности утилит и динамике развития - первое) и мой выбор был за ним. Теперь - тесты: Итак... для меня стояла задача определить битрейт, при котором сжатый файл при прослушивании не имеет отличий от оригинала. Именно с таким битрейтом я и намеревался сжимать коллекции CDA, проходящие через мои руки... Используещееся железо - профессиональная мастеринговая звуковая плата Marian Marc2 на AKM преобразователях, имеющая интерфейс для подключения к CD-ROMу по цифровому каналу; изодинамические наушники ТДС-7 (линейный стандарт). В слепом тесте использовались уши мои (у меня очень чуткий слух - например, я различаю на слух частотную локацию noise shaping при уровне -90дб. после даун-сэмплинга) и уши мои друга и коллеги, которые я считаю референсными - он способен на слух фиксировать малейшие изменения в характере звука и обладает природным чувством завершённости и чистоты звука. Полоса слышимости у нас идентичная: 25 - 16 000 герц (я думаю, что способностью воспринимать ультразвуковой диапазон могут похвастаться только дети, где-то до 15-летнего возраста), но, тем не менее, его уши всё же точнее, чем мои... Для теста была взята дорожка с фирменного диска - группа Yes, альбом 74 года - диск с грамотно сфомированной фазовой, спектральной, частотной и силовой сотавляющей (мой опыт показывает, что наиболее качественный ре-мастеринг при тиражировании CD существовал до начала 90-х годов, пока не появились новомодные максимайзеры и лимитеры и, пока все студии звукозаписи не бросились производить диски с абсолютно прямой АЧХ (а не ниспадающей) и с мощностью RMS аж минус 10дб, при которой говорить о сохранении чистоты и прозрачности звука не приходится - сплошные brickwalls). Итак... мною было создано четыре WAV фрагмента, из которых один оригинальный (при граблении CDA использовалась без сомнения лучшая програма для этой задачи - EAC (Exact Audio Copy)), а три остальных - восстановленные из Ogg Vorbis, с битрейтами, равными 192, 256 и 320 kbps.... Мой референсный друг (не знающий, что есть что) сразу же отмёл вариант, восстановленный из файла, закодированного с битрейтом 192, как самый худший, из чего я сразу же сделал вывод, что кодировать с этим битрейтом я не буду. И далее..... он уже не слышал ощутимой разницы.... Все остальные файлы показались ему идентичными по звучанию. И тогда я, соответственно, выбрал самый минимальный битрейт из оставшихся - 256. К слову сказать - первый эксперимент проводился с кодировщиком GT3b2. Последующие экперименты с новыми кодировщиками Ogg Vorbis картину не изменили, из чего следует, что кодек уже довольно долгое время топчется на месте, и никаких кардинальных изменений в качестве кодирования не произошло (речь идёт о высоких значениях битрейта!). Добавляются лишь служебные функции управления кодеком... У меня есть мечта - дождаться релиза кодека, который будет сопоставим по качеству с давно умершим кодеком LQT от Liquid Audio, если это позволят очграничения его математической модели.... Чтобы битрейт 192 kbps был максимально возможным битрейтом для достоверной передачи данных в диапазоне восприятия человеческого слуха. От себя для всех рекомендую битрейты сжатия звука - 256 kbps для сжатия музыки с качеством, неразличимым на слух от оригинала (это максимум), и 160 kbps для сжатия звука с качеством, не вносящим существенные искажения в исходный материал (это минимум). От себя хотелось бы пожелать более динамичного развития кодеку именно в плане повышения качества кодирования (выравнивания высоко-частотной составляющей в диапазоне от 8 до 16 килогерц и повышения планки охвата высокочастотной составляющей). Привет всем!