Математическая основа Ogg Vorbis

Список разделов Ogg Vorbis Тех-поддержка

Описание: Инструменты, кодеки, сопроводительная информация, алгоритмы, программирование.

Сообщение #1 Dnv » 21.03.2006, 20:28

Здравствуйте, Евгений.
Не могли бы Вы написать мне какая математическая
основа ogg? Пожалуйста подробно на английском
языке(если можно с переводом).Материал необходим
для красивого сообщения(15-20 мин.) на урок по английскому языку широкой
публике имеющее отношение к математике(студенты).
Dnv
Репутация: 0
С нами: 18 лет

Сообщение #2 VEG » 22.03.2006, 17:01

Dnv:Здравствуйте, Евгений.
Не могли бы Вы написать мне какая математическая
основа ogg? Пожалуйста подробно на английском
языке(если можно с переводом).Материал необходим
для красивого сообщения(15-20 мин.) на урок по английскому языку широкой
публике имеющее отношение к математике(студенты).
Могу посоветовать обратиться к первоисточникам. Основным документом могут служить спецификации формата, которые находятся в каталоге doc архива с исходными кодами (основная информация в Vorbis I spec):
http://downloads.xiph.org/releases/vorbis/libvorbis-1.1.2.tar.gz
На русском языке по этому имеются лишь небольшие вырезки, где все рассказано только в общих чертах. Так что основной уклон будет именно в этот документ. Если есть возможности - можно заняться переводом спецификаций для любознательных и желающих попробовать себя в доработке формата;)
За дополнительными подробностями именно с математическим уклоном обратитесь к материалам по алгоритмам MDCT и FFT, которые лежат в основе Ogg Vorbis. По этим алгоритмам проведено множество исследований, и я думаю, что через Google вы сможете найти еще массу материала. На русском языке, думаю, тоже будет достаточно документов. Но не стоит забывать, что в Ogg Vorbis эти алгоритмы применены далеко не «в лоб», и ознакомиться с официальными спецификациями обязательно стоит.
VEG M
Администратор
Аватара
Откуда: Finland
Репутация: 40
С нами: 18 лет 4 месяца

Сообщение #3 Dnv » 22.03.2006, 19:46

Большое спасибо за предоставленную информацию.
Dnv
Репутация: 0
С нами: 18 лет

Сообщение #4 VEG » 03.06.2006, 14:28

Еще интересные материалы по теме:
http://www.free-comp-shop.com/vorbis.pdf — Notes on Ogg Vorbis and the MDCT
http://www.mp3-tech.org/programmer/docs/embedded_vorbis_thesis.pdf — Ogg Vorbis in embedded systems
Все на английском языке. Если кто-то желает — можете заняться переводом.
VEG M
Администратор
Аватара
Откуда: Finland
Репутация: 40
С нами: 18 лет 4 месяца

Сообщение #5 cranium » 03.02.2007, 20:26

Может кто занимался сравнением некоторых форматов на физическом уровне, если можно так сказать, а не на уровне субъективного восприятия? Хотелось бы курсовую по акустике посвятить сравнению Mpeg layer III и ogg/vorbis. Буду очень благодарен, если кто чего посоветует, например, по каким критериям сравнивать, чтобы отчетливо выделялись достоинства одного и недостатки другого и т.п.?
Еще меня очень волнует проблема, касающаяся спецификаций на mp3? ФОрмат ведь закрытый, поэтому точных алгоритмов найти не удастся, а те что есть - приблизительные и достаточно обобщенные, я прав?
Спасибо за внимание.
cranium
Откуда: Minsk
Репутация: 0
С нами: 17 лет 1 месяц

Сообщение #6 VEG » 04.02.2007, 00:10

У mp3 спецификации тоже открыты (если бы этого не было, то не появился бы LAME). Но mp3 запатентован, а Ogg Vorbis — нет. WMA и закрыт, и запатентован.
А сравнивать похоже придется спектрограммы :)
VEG M
Администратор
Аватара
Откуда: Finland
Репутация: 40
С нами: 18 лет 4 месяца

Сообщение #7 cranium » 05.02.2007, 00:42

Неужели у этих форматов алгоритмы практически одинаковые, что и сравнивать нечего? Имеется ввиду все то, что влияет на качество в конечном итоге, например психоакустические модели наверняка различные... может и еще что существенное есть.
Не подскажите пару ссылочек на спецификации mp3? Что-то мне подсказывает что то, что я скачивал - немного не то... Заранее благодарен.
cranium
Откуда: Minsk
Репутация: 0
С нами: 17 лет 1 месяц

Сообщение #8 VEG » 05.02.2007, 18:25

Психоаккустика у них абсолютно разная. Ну и у Ogg Vorbis есть еще несколько своих «хитрых» алгоритмов, из-за чего качество у последнего субъективно лучше. Похожи они лишь тем, что используют алгоритмы MDCT и FFT для преобразования из амплитудно-временной в частотную характеристику. И даже здесь у Ogg Vorbis есть определенные улучшения, из-за чего он позволяет кодировать non-stop музыку. А дальше вступает в дело психоаккустика и т.д. Вот на этом этапе у этих форматов ничего общего.
Ну а спецификации MP3 вроде как и есть, но не совсем ясно, где их можно раздобыть. Где-то из области ISO. Возможно, что даже придется заплатить денег.
Хотя есть вариант, что что-то полезное есть в документации к MP3 Lame.
Ты, кстати, из какого ВУЗа? Просто интересно :)
VEG M
Администратор
Аватара
Откуда: Finland
Репутация: 40
С нами: 18 лет 4 месяца

Сообщение #9 Synth » 05.02.2007, 20:18

cranium:Не подскажите пару ссылочек на спецификации mp3?

Можно попробовать что-нибудь на http://www.mp3-tech.org поискать. И вот здесь какие-то материалы есть: http://www.multiweb.cz/twoinches/MP3inside.htm
Synth
Аватара
Откуда: Омск
Репутация: 0
С нами: 17 лет 9 месяцев

Сообщение #10 cranium » 06.02.2007, 01:19

Synth
Можно попробовать что-нибудь на http://www.mp3-tech.org поискать. И вот здесь какие-то материалы есть: http://www.multiweb.cz/twoinches/MP3inside.htm
Спасибо за подборку, глянем.

VEG
Психоаккустика у них абсолютно разная.
За это благодарствую.
Возможно, что даже придется заплатить денег.
Вот это конечно плохо, да и на такой шаг врядли пойду. Впринципе должно хватить общей схемы работы алгоритма сжатия, все остальное найдется и можно будет расписать, т.к. и то же БПФ/ОБПФ и ДКП/ОДКП, БС хорошо известны и расписаны. Думаю, проблемы будут найти точную психоакустическую модель.
...из-за чего он позволяет кодировать non-stop музыку.
Простите неграмотного, что есть non-stop музыка?

Еще один момент, который хотелось бы уяснить. Простите, если не по теме вопрос, но видел тесты сравнения некоторых форматов (например, на главной странице данного портала) специалистами в области звука, с приведениемвсяческих зависимостей и выводов. Вещь очень интересная. Так вот, такие эксперименты как часто проводятся и кем (может есть определенные организации, которые себя зарекомендовали в этой области), чтобы можно было ознакомиться с результатами? Спасибо.

P.S.:
Ты, кстати, из какого ВУЗа? Просто интересно
БГУИР

P.P.S.: надеюсь, завтра утвердят тему курсового окончательно.
cranium
Откуда: Minsk
Репутация: 0
С нами: 17 лет 1 месяц

Сообщение #11 VEG » 06.02.2007, 02:07

Простите неграмотного, что есть non-stop музыка?
Это музыка, в которой между треками нет пауз. То есть Ogg Vorbis не добавляет тишину в начало и в конец файла, из-за чего длина трека не изменяется.
Еще один момент, который хотелось бы уяснить. Простите, если не по теме вопрос, но видел тесты сравнения некоторых форматов (например, на главной странице данного портала) специалистами в области звука, с приведениемвсяческих зависимостей и выводов. Вещь очень интересная. Так вот, такие эксперименты как часто проводятся и кем (может есть определенные организации, которые себя зарекомендовали в этой области), чтобы можно было ознакомиться с результатами? Спасибо.
Проводятся не очень часто. Чаще всего на http://hydrogenaudio.org/ . Например:
http://www.hydrogenaudio.org/forums/index.php?showtopic=35438
http://www.hydrogenaudio.org/forums/index.php?showtopic=36465
БГУИР
Родной универ :) Какой факультет, специальность, курс?
VEG M
Администратор
Аватара
Откуда: Finland
Репутация: 40
С нами: 18 лет 4 месяца

Сообщение #12 cranium » 06.02.2007, 21:45

VEG,
спасибо за разъяснения и за ссылки.
Факультет ТК, спец-ть РРТ, курс 4.
Дисциплина, по ходу которой пишем курсовой - радиовещание и электроакустика.
Кстати, в статье под названием "ANALYSIS AND IMPROVEMENT OF THE MPEG-1 AUDIO LAYER III ALGORITHM AT LOW BIT-RATES" by Ramapriya Rangachar достаточно интересную нашел информацию, а именно: в разделе 6 - "THE ASU MP3TOOL: IMPLEMENTATION OF THE MP3 ALGORITHM IN MATLAB". Сразу кинулся в google за поиском подобных вещей. Что-то найти удалось, но еще не смотрел толком что именно). Может и для Ogg существуют нечто похожее?
P.S.: ура, тему одобрили, можно приниматься за дело)
cranium
Откуда: Minsk
Репутация: 0
С нами: 17 лет 1 месяц

Сообщение #13 VEG » 07.02.2007, 11:06

Я раньше сам проводил кучу нестандартных и интересных тестов. Пробовал сжимать картинки аудиокодеками (было интересно что получится), вычислял и слушал разницу в файлах...
Для того, чтобы услышать (и увидеть на спектрограмме), какие именно частоты выкинул кодер, в далеком 2005 я написал программу sndcmp.exe. Она не понимает WAV (было лень писать поддержку, ведь для себя писал) и принимает только RAW формат. На вход подаются 2 файла: исходный и после кодирования. На выходе — разница между ними. Как бонус я дописал поиск точного смещения в MP3, так что теперь можно тестировать таким образом и не gapeless кодеки. Ну и еще для статистики эта программа выводит оценку физической разницы между файлами... Последний, конечно же, не обязательно говорит о качестве :) Но графики зависимости этой оценки от битрейта можно построить тоже для интереса.
нашел информацию, а именно: в разделе 6 - "THE ASU MP3TOOL: IMPLEMENTATION OF THE MP3 ALGORITHM IN MATLAB".
Для Ogg Vorbis вроде такого не было :) Есть реализация элементарного кодера от ffdshow, которая кодирует без психоаккустики (посмотри в новостях). Если надо разобраться, как устроен сам формат — само то исследовать именно те исходные коды.
VEG M
Администратор
Аватара
Откуда: Finland
Репутация: 40
С нами: 18 лет 4 месяца

Сообщение #14 cranium » 07.02.2007, 11:19

VEG,
как всегда... большое спасибо ;-)
cranium
Откуда: Minsk
Репутация: 0
С нами: 17 лет 1 месяц

Сообщение #15 cranium » 23.02.2007, 13:56

К своей большой радости нашел ogg_toolbox для работы в MatLab с 2 функциями: чтения и записи.
Кому интересно, архив находится здесь
А также для FLAC можно найти тут
cranium
Откуда: Minsk
Репутация: 0
С нами: 17 лет 1 месяц

След.

Вернуться в Тех-поддержка



cron