FLAC битрейт

Количество песен, которое Вы можете сохранить на Вашем плеере Sansa, варьируется в зависимости от емкости и типа файлов, которые Вы используете.
Файлы OGG или FLAC обладают гораздо большей емкостью из-за более высокого качества. Это может повлиять на количество файлов, которые могут храниться на устройстве.
График ниже показывает приблизительное количество песен длиной 3 минуты 30 секунд со скоростью 128Kbps в MP3-формате. Цифры, перечисленные ниже, ограничены физическим объемом памяти плеера Sansa.

512MB

1GB

2GB

4GB

8GB

16GB

32GB

Количество песен

125

250

500

1000

2000

4000

8000

Ограничение базы данных MP3 плеера Sansa:

Clip Sport Go

16ГБ: 4000 треков только на внутренней памяти
32ГБ: 8000 треков только на внутренней памяти

Clip Sport Plus и Clip Voice
4000 треков на внутренней памяти
Clip Sport и Clip Jam
2000 треков на внутренней памяти и
2000 треков на внешнем носителе памяти
Примечание: Внутренняя и Внешняя базы данных не объединены на плеере Clip Sport и Clip Jam.
Sansa Clip версии 1 и 2, Sansa Clip+ , Sansa Clip Zip, Sansa Fuze версии 1 и 2:
6000-8000 песен
Sansa Fuze+
10000 песен
ПРИМЕЧАНИЯ:
— Подпапки и длинные имена файлов могут использовать несколько записей в базе данных. В связи с этим, если у Вас много подпапок или файлов с длинными именами, фактическое количество песен может быть меньше, чем указанное в ограничении базы данных .
— Все перечисленные товары Sansa (не включая Sansa Clip версии 1 и 2, Clip Sport Plus, Clip Voice) поддерживают карты до 32 Гб MicroSDHC. Использование карты 32 ГБ вместе с устройством Sansa 8ГБ может привести к превышению физической памяти ограничения базы данных. Это делается для библиотек Lossless . Файлы OGG или FLAC намного больше, чем MP3 или WMA. Карты с большей емкостью поддерживаются для размещения библиотек Lossless.

В этом посте я хочу рассказать о том, как получать наилучшие результаты при сжатии музыкального материала в форматы FLAC и MP3. В эпоху массового распространения стриминговых аудио- и видеосервисов эта тема может показаться малоактуальной, однако, как показывает практика, это не так. Во-первых, не все хотят быть зависимыми от сторонних ресурсов, которые в любой момент могут повести себя как угодно — от введения разнообразных ограничений на доступ к контенту до полного его удаления. Во-вторых, в мире есть множество мест, где интернет работает медленно, печально и с перерывами на обед. В-третьих, качество звучания при онлайн-прослушивании обычно вполне приемлемо для большинства пользователей, но искушенных слухачей с хорошей аппаратурой оно может ввергнуть в тоску. Учитывая всё вышесказанное, можно полагать, что тема самостоятельного сжатия аудиозаписей для их хранения и прослушивания оффлайн останется актуальной ещё достаточно долго.

Так как в статье будут рассматриваться консольные приложения Windows, то предполагается, что читатель знаком с основами работы в командной строке под этой операционной системой.

Базовые понятия

PCM (pulse code modulation), она же ИКМ (импульсно-кодовая модуляция) — способ представления аналогового сигнала в цифровом виде. Работает это так: на вход устройства под названием АЦП (аналого-цифровой преобразователь) подаются электрические колебания, представляющие из себя аналоговый звуковой сигнал. АЦП с определенной частотой замеряет уровень этого сигнала и передаёт полученные значения наружу, где они сохраняются. Таким образом формируется массив данных, представляющий из себя последовательность значений амплитуды исходного сигнала. Описанный процесс называется «оцифровка». Основной проблемой хранения PCM-данных в «голом» виде является довольно большой их объём, поэтому для более рационального использования места на носителе используются различные алгоритмы сжатия цифрового звука.

WAV — аудиоформат, стандартно использующийся для хранения несжатого PCM-аудио в Windows. Формат может содержать в себе и сжатые данные, но на практике подобное встречается крайне редко и, можно сказать, является моветоном. Проигрывание WAV-файлов требует минимум ресурсов системы, так как никакой дополнительной обработки информации для этого не требуется. Сохранение материала в этом формате почти всегда является промежуточным шагом при обработке звука в аудиоредакторах, CD-грабберах и другом подобном ПО. Битрейт несжатого WAV с параметрами 16 бит/44.1 кГц/стерео — 1411 кбит/с, размер файла пятиминутной записи в таком виде — около 52 МБ.

Кодер (или «энкодер» от английского «encoder») — программное обеспечение, предназначенное для преобразования WAV в какой-либо иной формат с целью уменьшения объёма хранимых данных.

Декодер — программное либо аппаратное обеспечение, служащее для воспроизведения сжатых в соответствующий формат файлов или преобразования их в неcжатый вид.

Lossy — общее название семейства аудиоформатов, в которых используется сжатие данных с потерями. Типичными представителями семейства являются MP3, AAC, WMA, Ogg Vorbis. Главная особенность lossy-форматов заключается в том, что при сжатии материала в любой из них значительная часть исходной звуковой информации теряется безвозвратно и не может быть восстановлена впоследствии никаким способом. За счёт этого достигается высокая степень компрессии, при этом на слух потери малозаметны или вообще незаметны, так как отбрасываются только некритичные для человеческого восприятия данные.

Lossless — общее название семейства аудиоформатов, в которых используется сжатие данных без потерь. Типичные представители семейства: FLAC, Monkey’s Audio (APE), ALAC, WavPack. В отличие от lossy-форматов, здесь никакая информация при сжатии не теряется, всё происходит примерно как в обычных архиваторах. Платой за полную сохранность данных является значительно меньшая по сравнению с lossy степень компрессии.

MP3 (MPEG-1 Layer 3) — исторически первый и самый распространённый формат сжатия с потерями. Несмотря на то, что в силу возраста MP3 на сегодняшний день не блещет эффективностью компрессии, его популярность остаётся весьма высокой по причине универсальности — проигрывать данный формат умеет любой утюг. При этом, если применяются адекватные кодер и декодер, качество звучания MP3 находится на очень достойном уровне. Сочетание этих двух факторов делает использование формата оправданным и сейчас. Коэффициент сжатия MP3 при сохранении высокого качества звучания — 6-9 раз. Средний битрейт такого MP3 с параметрами 16 бит/44.1 кГц/стерео — 150-240 кбит/с, размер файла пятиминутной записи в этом виде — 6-9 МБ.

FLAC (Free Lossless Audio Codec) — самый популярный на текущий момент формат сжатия аудио без потерь. Если для какого-либо ПО или оборудования заявлена поддержка lossless, почти наверняка данное ПО/оборудование умеет проигрывать FLAC. Формат является стандартом де-факто в среде любителей качественного звука. Коэффициент сжатия FLAC — 1.3-2.8 раза. Битрейт FLAC с параметрами 16 бит/44.1 кГц/стерео — 500-1100 кбит/с, размер файла пятиминутной записи в таком виде — 18-40 МБ.

В заключение раздела приведу картинку, наглядно иллюстрирующую ключевые особенности вышеописанных аудиоформатов:

Общие вопросы

Можно ли пережимать материал из lossless в lossy — например, из FLAC в MP3?

Можно и часто нужно. Например, если вы хотите слушать музыку в «походных» условиях с портативного устройства без аудиофильских замашек, а исходный материал у вас хранится в lossless-формате, то перед переносом на портатив имеет смысл сконвертировать нужные треки в lossy. Так вы уменьшите размер файлов и сможете сохранить на мобильном носителе значительно больше музыки. Деградации звука от такого преобразования вы, скорее всего, не почувствуете совсем.

Можно ли пережимать материал из lossy в lossless — например, из MP3 во FLAC?

Делать этого не следует ни в коем случае, так как качество звучания лучше не станет, а размер файлов вырастет в разы. Более того, такой псевдо-lossless, впоследствии попавший к другим людям, будет вводить их в заблуждение. Когда вы скачиваете lossless из сети, для определения и отбраковки подобных фейков используйте программу auCDtect.

Можно ли пережимать материал из lossy в lossy — например, MP3 с меньшим битрейтом в MP3 с бо́льшим битрейтом?

Если вы хотите получить от подобного пережатия улучшение качества, то нет, так делать не нужно — звучание не только не улучшится, а даже слегка ухудшится. Если вашей целью является уменьшение размера файла и качество звучания не очень критично, то пережатие из более высокого в более низкий битрейт вполне оправданно.

Какой из lossless-форматов лучше по качеству звучания — FLAC, Monkey’s Audio, WavPack?

Как уже говорилось ранее, lossless-форматы сжимают данные без потерь. Это означает, что в плане качества звучания все они абсолютно идентичны. Выбирать lossless-формат для использования в каждом конкретном случае следует, ориентируясь исключительно на его совместимость с ПО/оборудованием и на ваши личные предпочтения.

Влияют ли выбор кодера и его настройки на качество звучания при сжатии материала в MP3?

Существенно влияют. Про то, какой кодер и с какими настройками обеспечивает оптимальный результат, я расскажу ниже.

Влияет ли декодер на качество звучания при прослушивании материала в MP3? Чем лучше воспроизводить MP3 на ПК?

MP3-декодер может влиять на качество звучания. Некоторые (особенно старые) декодеры заметно искажают звук при проигрывании MP3, что может создать ложное впечатление об ущербности этого формата как такового. Для проигрывания музыки на ПК следует пользоваться проверенными программами-плеерами, желательно последних версий. Я использую foobar2000, который всем и рекомендую — у него проблем с качеством воспроизведения как MP3, так и других поддерживаемых форматов нет.

Влияют ли настройки кодера на качество звучания при сжатии материала во FLAC? Какую степень сжатия лучше выбрать?

Настройки FLAC-кодера на качество звучания не влияют совсем. От них могут зависеть только размер получаемых файлов и время, затраченное на сжатие, да и то незначительно. Поэтому чаще всего я не заморачиваюсь и кодирую во FLAC с настройками по умолчанию, что советую делать и вам. В редких случаях, когда требуется получить файлы минимального размера и приходится экономить каждый байт, имеет смысл увеличить степень сжатия до максимального значения.

Влияет ли декодер на качество звучания при прослушивании материала во FLAC? Чем лучше воспроизводить FLAC на ПК?

В случае с FLAC и другими lossless-форматами декодер на качество звучания не влияет, исходные аудиоданные при воспроизведении восстанавливаются с точностью до бита. Поэтому для прослушивания FLAC можно использовать любой плеер, который поддерживает данный формат и нравится лично вам. Однако, я ещё раз порекомендую foobar2000 как проверенное временем универсальное решение для проигрывания музыки под Windows.

Кодирование и декодирование MP3 при помощи LAME

Как уже говорилось выше, в случае с MP3 качество звучания итоговых файлов напрямую зависит от выбора кодера и его настроек при сжатии. На сегодняшний день наилучшие результаты для данного формата даёт кодер LAME. Оригинальный сайт проекта выглядит несколько запутанно, поэтому сразу дам . Из архива нам нужен файл lame.exe. Открываем командную строку.

Для получения краткой справки по использованию LAME наберите lame —help (информация будет выведена на экран) или lame —help > usage.txt (информация будет выведена в файл usage.txt). Для получения подробной справки замените —help на —longhelp.

Перейдём непосредственно к функционалу сжатия. Следует ли указывать битрейт и другие настройки компрессии по отдельности? Нет, это совершенно не обязательно, разработчики сделали бо́льшую часть работы за нас, максимально упростив использование кодера. В LAME заложен набор пресетов (предустановок), позволяющих пользователю получать отличный результат при минимуме технических знаний. Почти все пресеты используют режим VBR (Variable Bit Rate, переменный битрейт), что даёт оптимальное соотношение качества звучания и размера файла. Справка по пресетам вызывается командой lame —preset help. Рассмотрим наиболее актуальные из предустановок.

Пресет standard. Описание из встроенной справки:

Этот пресет должен быть «прозрачен» для большинства людей на большей части музыки, обладая достаточно высоким качеством.

Средний битрейт при использовании standard составляет 170-210 кбит/с, срез ВЧ начинается примерно с 18.7 кГц. Рекомендую использовать данный пресет как режим по умолчанию, он является наиболее сбалансированным по сочетанию характеристик.

Кодирование WAV в MP3 с данным пресетом:

lame —preset standard infile.wav outfile.mp3, где infile.wav — имя исходного WAV-файла, outfile.mp3 — имя получаемого MP3-файла (последнее можно не указывать).

Пресет extreme. Описание из встроенной справки:

Если вы обладаете крайне хорошим слухом и таким же оборудованием, этот пресет даст чуть более высокое качество, чем standard.

Средний битрейт при использовании extreme составляет 220-260 кбит/с, ВЧ-фильтр не задействуется. Рекомендую использовать данный пресет в тех случаях, когда требуется получить MP3 с очень высоким качеством звучания. При прослушивании музыки на среднестатистическом оборудовании этот пресет по сравнению со standard обычно не даёт ничего, кроме увеличения размера файла.

Кодирование WAV в MP3 с данным пресетом:

lame —preset extreme infile.wav outfile.mp3

Пресет insane. В отличие от предыдущих пресетов, использующих VBR, этот использует режим с постоянным битрейтом 320 кбит/с. Описание из встроенной справки:

Этот пресет будет перебором для большинства людей в большей части ситуаций, но, если вам необходимо получить наивысшее качество без оглядки на размер файла, то вперёд.

Использовать insane я не рекомендую в силу его практической бессмысленности. Если вас мучают приступы перфекционизма, используйте не MP3 с заоблачными настройками, а какой-нибудь из lossless-форматов. Например, FLAC.

Декодирование MP3 в WAV:

lame —decode infile.mp3 outfile.wav

Кодирование и декодирование FLAC

Рассмотрим сжатие файлов кодером FLAC, скачать который можно . Для работы нам нужен файл flac.exe. Если запустить его без параметров, будет выдана краткая справка по использованию кодера. Для получения подробной справки наберите flac —help (информация будет выведена на экран) или flac —help > usage.txt (информация будет выведена в файл usage.txt).

Кодирование WAV во FLAC со степенью сжатия по умолчанию (5):

flac infile.wav

Кодирование WAV во FLAC с указанной степенью сжатия:

flac -n infile.wav, где n — число от 0 (минимальное сжатие) до 8 (максимальное сжатие).

Декодирование FLAC в WAV:

flac -d infile.flac

Чтобы убедиться в том, что FLAC сжимает данные действительно без потерь, можно использовать любое ПО, умеющее сравнивать файлы побитно — например, встроенную в Windows утилиту fc. Для эксперимента выбираем любой WAV-файл и делаем с ним следующие преобразования: original.wav (оригинальный файл) > compressed.flac (кодируем файл во FLAC) > decompressed.wav (декодируем FLAC обратно в WAV). Далее сравниваем original.wav и decompressed.wav при помощи fc в режиме двоичного сравнения:

fc /b original.wav decompressed.wav

По завершении проверки утилита выдаст сообщение «различия между файлами не найдены», что говорит об их полной идентичности. Это означает, что при конвертации во FLAC и обратно ни один бит не был потерян, что и требовалось доказать. Если проделать тот же опыт с MP3, то результат будет совсем иной, различий между файлами обнаружится огромное количество.

Автоматизация сжатия при помощи foobar2000

Работа через консоль — это, конечно, хорошо, но для регулярного применения процесс преобразования форматов хочется сделать более простым и удобным. Для решения данной задачи прекрасно подходит плеер foobar2000, о котором я уже упоминал выше. Этот проигрыватель имеет встроенный конвертер файлов, настройку которого мы и рассмотрим пошагово.

Для начала добавим в конвертер пресеты для LAME:

1) Открываем foobar, добавляем в его плейлист несколько файлов. Кликаем правой кнопкой мыши на любом треке из плейлиста, выбираем Convert > … В открывшемся окне Converter Setup в блоке Current Settings выбираем пункт Destination — здесь можно настроить, куда и как foobar будет сохранять созданные файлы. При необходимости корректируем эти параметры, затем жмём Back.

2) Нажимаем Output format > Add New, в появившемся окне заполняем поля как на скриншоте:

В поле Encoder file следует указать полный путь к файлу lame.exe. После того, как всё заполнено, жмём OK, затем Back.

3) Вернувшись в окно Converter Setup, сохраняем созданный пресет кнопкой Save Проходим пункты 2 и 3 заново, но на этот раз в параметрах и названии пресета меняем «standard» на «extreme». В результате в список Saved presets добавятся два пункта, запускающие LAME в режимах standard и extreme. Теперь можно перекодировать в MP3 любые файлы из плейлиста foobar, просто выделив их мышкой и выбрав в контекстном меню Convert > название нужного пресета:

Настроить FLAC ещё проще. В окне Converter Setup в блоке Current Settings выбираем Output format, далее в списке пресетов выбираем FLAC, жмём Back. Вернувшись в Converter Setup сохраняем новый пресет с именем FLAC:

Всё, теперь сжатие во FLAC доступно через контекстное меню Convert так же, как и сжатие в MP3. Нюанс: при первом запуске процесса конвертации откроется окно, в котором надо будет указать, где находится файл flac.exe.

К слову. У пользователей часто возникает вопрос, как разбить на отдельные треки альбом, скачанный в виде одного большого FLAC-файла с дополнением в виде файла разметки Cue sheet. Настроив foobar, как описано выше, мы можем сделать это в несколько кликов: открываем файл с расширением .cue, выделяем появившиеся в плейлисте треки и преобразуем их в отдельные файлы через контекстное меню Convert > FLAC.

Завершая данную статью, не могу обойти стороной один из самых популярных вопросов обывателей — что же лучше, FLAC или MP3? Спрашивающий обычно хочет получить простой, однозначный и справедливый для всех случаев ответ. Однако, такового нет и быть не может. Далее я изложу своё мнение по части того, когда и почему следует применять каждый из обсуждаемых форматов.

Что касается качества звучания, то опыт показывает, что при грамотном подходе к процессу сжатия MP3 разница между ним и lossless-форматами на слух исчезающе мала в подавляющем большинстве ситуаций. Надежно фиксировать отличия могут только хорошо тренированные люди при прослушивании подходящей музыки на высококлассном оборудовании. Да, существуют специально подобранные тестовые сэмплы, на которых артефакты lossy-сжатия отчётливо заметны каждому, но задайте себе вопрос — вы планируете слушать эти сэмплы или всё-таки обычную музыку? В общем, вывод очевиден — MP3 более чем подходит как формат хранения музыки для высококачественного воспроизведения. Но повторю ещё раз: данный тезис справедлив только в том случае, если аудиофайлы приготовлены правильно. К сожалению, сеть наводнена MP3-шками, звучание которых откровенно погано вовсе не из-за ущербности самого формата, а по причине использования старых или изначально убогих кодеров.

Чтобы составить собственное непредвзятое мнение по обсуждаемому вопросу, настоятельно рекомендую читателю лично потестировать разные форматы в слепых тестах. Это не только познавательное, но и достаточно увлекательное занятие.

Теперь рассмотрим преимущества, которые даёт использование FLAC или других lossless-форматов.

  1. В отличие от ситуации с MP3, где качество результата сильно зависит от квалификации кодирующего, испортить звучание сжатием во FLAC невозможно в принципе. Поэтому вопрос, чем и как кодировался материал теряет свою актуальность (за исключением ранее описанных клинических случаев изготовления FLAC из lossy, но это легко проверяется). При прослушивании музыки в lossless вы можете быть уверены, что огрехи в звучании, если таковые имеются — не результат приложения чьих-либо кривых рук на этапе сжатия, а свойство исходной фонограммы, с которым просто надо смириться.
  2. Сама уверенность в том, что запись хранится «как есть», без необратимых потерь в ней, некоторым людям доставляет психологический комфорт. В такой тонкой области, как аудио, данный фактор может быть весьма значимым.
  3. Материал в lossless идеально подходит для разнообразной обработки — его можно пережимать в любые другие форматы, редактировать, резать на сэмплы без боязни получить на выходе «мясо, вылепленное из консервов». Для тех, кто серьёзно работает со звуком, это немаловажно.

Всё перечисленное не про вас? Тогда заморачиваться с lossless вам нет никакого смысла, смело используйте MP3 либо другие lossy-форматы.

Лично я дома храню и слушаю музыку преимущественно во FLAC, собственноручно изготавливая из него MP3 при необходимости — например, для использования в портативных устройствах.

Метки: работа с аудиозаписями

Поделиться ссылкой:

Аудиоформаты

Вниз

Разобраться во всех доступных сегодня аудиоформатах достаточно сложно, у каждого из них есть свое назначение и свои преимущества. Условно все аудиоформаты можно разбить на три группы по степени сжатия и потерям качества.

Аудиоформаты без жатия данных

WAV (.wav) – основной формат для хранения и обработки звука в Windows. Отличается превосходным качеством, обратной стороной чего является большой размер WAV-файлов – 10 Мб в минуту.

AIFF (.aiff) – аналог WAV для компьютеров Macintosh, но благодаря отличному качеству звука и богатым возможностям получил популярность и на других платформах. Широко применяется в семплерах и синтезаторах.

MIDI (.midi) – трудно поставить в один ряд с другими форматами. Дело в том, что файлы MIDI не содержат записи звука, а лишь команды синтезатору воспроизвести ту или иную ноту инструмента из заданного набора. При этом файлы получаются крайне компактными, но звучат они на разных устройствах очень по-разному.

Аудиоформаты со сжатием без потерь качества

FLAC (.flac) – благодаря фирменному алгоритму сжатия FLAC-файлы занимают не так много места, как, скажем, WAV (примерно в 1,5-2 раза меньше). Для воспроизведения таких файлов от плеера или коммуникатора требуется высокая производительность.

APE (.ape) – чемпион по коэффициенту компрессии среди форматов без потерь качества. При этом APE имеет два существенных недостатка – высокие требования к производительности плеера и невысокую распространенность.

M4A, или Apple Lossless (ALAC, ALE, .m4a) Разработан компанией Apple, однако со временем стал открытым форматом. Размер файлов в M4A не слишком большой – в среднем на 50% меньше оригинала, однако отличаются отменным качеством. При этом с проигрыванием M4A справляются и относительно медленные устройства, что делает его очень удобным для портативных плееров – тех же iPod.

WavPack (.wv) – альтернатива FLAC. Это открытый формат с очень любопытными возможностями. Особенно интересен тем, что позволяет кодировать звук в два файла: один с потерями качества и другой добавочный, позволяющий восполнить потери аудиопотока, если возникла такая необходимость.

Аудиоформаты со сжатием и потерями качества

MP3 (.mp3) – самый распространенный цифровой аудиоформат. Обязан этим высокому коэффициенту сжатия и хорошему (в случае высокого битрейта – 256 и 320 Кбит/с) качеству звука. Сжатие в MP3 основано на удалении «лишних”, согласно психоакустичесткой модели, компонентов сигнала – например, частот, которые человеческое ухо не воспринимает.

AAC (.3gp, .mp4, .aac) – закрытый формат, который позиционируется как логическое развитие MP3. Выдает более качественный звук с меньшими потерями и улучшенной технологией кодирования. Поддерживается большинством портативных устройств.

OGG Vorbis (.ogv, .oga) – свободная альтернатива MP3 и AAC. По качеству превосходит MP3 (максимальный битрейт – 700 Кбит/с), однако уступает ему по распространенности, что и является его основным недостатком.

Real Audio (.ra) – спецформат, предназначенный для передачи звукового потока в реальном времени по медленным и ненадежным каналам связи. Аудиофайл продолжительностью 30 секунд должен передаваться не больше чем за 30 секунд, как бы ни была узка полоса пропускания. На высокое качество звука RA не претендует.

WMA (.wma) – целое семейство форматов, поддерживающих сжатие как с потерями качества, так и без. Разработан Microsoft, имеет встроенную систему защиты авторских прав DRM, которая позволяет прослушивать файлы только на том устройстве, на которое они были загружены из музыкального магазина.

Вверх

Cразу оговоримся, что статья говорит ТОЛЬКО об общих характеристиках и не будет включать в себя некоторые подробности. В будущем Лайфхакер проведёт собственное беспристрастное исследование. А сегодня попробуем обобщить уже так или иначе известный опыт.

Есть аналог и цифра.

Аналог — хорошо, но недолговечно и неудобно. Поэтому аналоговые носители, несмотря на высокие продажи винила, не вернутся.

Аудиоцифра может быть трёх основных типов:

  • в формате, не использующем сжатие;
  • в формате, использующем сжатие без потерь (lossless);
  • в формате, использующем сжатие с потерями (lossy).

На первый взгляд, более перспективны форматы, использующие сжатие без потерь. Это не всегда так, о чём мы подробнее расскажем в одном из следующих материалов. Форматы без сжатия не имеют какого-либо смысла, кроме хранения мастер-записей, необходимых при создании аудиоконтента. Они легче поддаются восстановлению. Для хранения и прослушивания домашних записей излишни.

Из множества параметров цифрового аудио пользователя в первую очередь должны волновать частота дискретизации (точность оцифровки аналогового сигнала по времени), разрядность (точность оцифровки по амплитуде — громкости), битрейт (количество содержащейся в файле информации в пересчёте на секунду).

Сегодня поговорим о lossy.

Для сжатого звука очень важно понятие психоакустической модели — представления учёных и инженеров о том, как человек воспринимает звук. Ухо воспринимает весь спектр поступающих на него акустических волн. Однако обрабатывает сигналы мозг.

Справочная величина слышимого человеком диапазона составляет от 16 Гц до 20 кГц, но одновременно слышать и осознавать все поступающие звуки он не способен.

Слух дискретен, и его звуковая восприимчивость нелинейна.

Современные психоакустические модели достаточно точно оценивают человеческий слух и постоянно улучшаются. На деле, несмотря на заверения любителей музыки, музыкантов и аудиофилов, для среднестатистического нетренированного слуха первоначальный вид MP3 в максимальном качестве стал предельно воспринимаемым. Исключения есть, их не может не быть. Но они не всегда легко заметны при слепом прослушивании.

Форматы, использующие психоакустические модели сжатия

Таких форматов для сжатия аудио с потерями довольно много. Наиболее распространены сегодня следующие.

OGG (Vorbis)

Вообще, файл с расширением *.ogg является «контейнером»: внутри могут находиться несколько звуковых записей с собственными тегами и характеристиками. Чаще всего хранимые в нём файлы сжимаются кодеком Ogg Vorbis, хотя могут использоваться и другие, в том числе MP3 или FLAC.

В качестве его основных преимуществ стоит назвать большой диапазон возможных параметров при кодировании: частота дискретизации звука может достигать 192 кГц, разрядность — 32 бит. По умолчанию OGG использует переменный битрейт (хотя при отображении свойств это не указывается), который может достигать 1 000 кбит/с.

MP3

В отличие от свободного OGG, MP3 разработан очень важным для современной акустики Обществом Фраунгофера — объединением институтов прикладных исследований Германии. В среде аудиофилов, кстати, это крайне уважаемая контора, правда, признаваться они в этом не любят. Но за их разработками пристально следят.

В отличие от OGG, может обладать как переменным (VBR), так и постоянным битрейтом (CBR). Кстати, именно благодаря MP3 обнаружилось, что не всякая запись может быть качественно кодирована с переменным битрейтом (причины смотрите выше, алгоритмы кодирования и их результаты в данном случае могут быть различны при кодировании одного и того же источника).

Ввиду преклонного возраста MP3 имеет значительные ограничения: разрядность может быть 16–24 бита, частота дискретизации выражается только в дискретных значениях (8, 11,025, 12, 16, 22,05, 24, 32, 44,1, 48), битрейт ограничен 320 кбит/с. К тому же в обычной версии MP3 число каналов ограничено двумя.

AAC

Те же грабли, только в профиль. Тоже разработка Общества Фраунгофера. Более поздняя и использует другую психоакустическую модель, более современную. Общедоступная информация позволяет сделать вывод: да, им удалось улучшить собственное творение.

Даже если опираться на самые простые цифры, AAC — более гибкий формат. Разрядность файлов, полученных при помощи этой разработки, составляет от 16 до 24, частота дискретизации тоже при желании позволит не потерять звуковой картины и лежит в диапазоне 8–192 кГц. Поток данных вообще приближается к таковым у lossless-форматов (до 512 кбит/с), при том что максимальное число каналов AAC-файлов достигает 48.

Какой формат стоит назвать однозначно лучшим

Если учесть, что AAC — переосмысленный спустя десяток лет MP3, то выбор в его пользу. При желании имеет смысл сравнивать только MP3 и OGG. Давайте посмотрим на картинки, сделанные уважаемым Андреем Аспидовым с ixbt.com:

На графиках — хороший AudioCD, сжатый OGG с переменным битрейтом 350 кбит/с и MP3 с использованием Lame. Чем ниже располагается график, тем ближе звучание к оригиналу. Получается очень интересная картина. Несмотря на то, что MP3 обладает явно срезанными высокими частотами, в отличие от OGG, в котором видно завал ниже 2 кГц.

Частотно-временное распределение звука говорит о не менее интересных вещах. При постоянном битрейте 320 кбит/с MP3 почти совпадает с оригинальной записью. Кажется, теперь всё встаёт на свои места. Но… На самом деле всё ещё больше запутывается.

Зачем вообще пользоваться lossy, когда есть доступный lossless

Здравый смысл.

Дело в том, что большая часть аналоговых записей не содержит того количества информации, которое необходимо было бы хранить в высококачественных форматах. Не стоит забывать, что родной частотой дискретизации для CD является 44,1 кГц, квантование — всего 16 бит.

Предыдущие графики неплохо демонстрируют высокую точность передачи MP3. А ведь для аудиокассеты, магнитной ленты (если, конечно, это не мастер-тейп) характеристики AudioCD недостижимы. Да и для массового студийного оборудования возможность записи аналогового звука, соответствующего AudioCD, появилась относительно недавно. Нет никакого смысла оцифровывать во FLAC (и тем более в WAV) концертную запись или пластинку из доцифровой эпохи, в особенности сделанные с магнитных носителей. Они не содержат тех спектров и того количества информации, которые могут хранить контейнеры без сжатия.

Что изменилось сегодня

Редкий звукорежиссёр делает цифровую мастер-запись (с которой затем производится размножение на физические носители), используя современные технологии на полную катушку. Поэтому шанс того, что 24-битный трек на самом деле всего лишь 16-битный, крайне высок.

Аналоговую высококачественную запись на высококачественном оборудовании сегодня встретить ещё сложнее — если только у фанатов подобного звучания. Таким, например, является Джек Уайт, экс-лидер группы White Stripes. При этом часть его записей относится к вариациям lo-fi, и искать там запредельные звуковые характеристики дорожки становится своеобразным удовольствием для гурманов.

Если представить себе идеальный исходник, то только тренированный слух или прослушивание на качественном аудиооборудовании позволит найти сжатый файл. И уже опираясь на это (и не забывая про восприятие), стоит сделать следующий вывод:

Необходимым и достаточным для среднеценового оборудования является AAC, в отсутствие которого (и при отсутствии исходников, которые можно кодировать в AAC) — MP3 с постоянным битрейтом 320 кбит/с, созданный при помощи кодека Lame 3.93 (рекомендуемые ключи при декодировании: —cbr -b320 -q0 -k -m s).

Исключение составляют записи, изначально полученные в высоком качестве, скажем, записанные на DVD-Audio, SACD, или записи, изначально собранные в DSD (или аналогичном формате) с высоким битрейтом.

Хотя кое-какие особенности у lossless есть. И о них мы расскажем в следующий раз.

Автор не любит Apple. Автор очень ценит достижения «фраунгоферов» и был предельно удивлён, узнав, что AAC — их работа. 🙂