Весь Мир Hi-Fi

Цифровой аудиоформат 24/192, и почему в нем нет смысла. Часть 2 [Перевод]

Что является одним из наиболее распространенных и глубоко укоренившихся заблуждений в мире меломанов?

Прим. перев.: Это перевод второй (из четырех) частей развернутой статьи Кристофера «Монти» Монтгомери (создателя Ogg Free Software и Vorbis) о том, что, по его мнению, является одним из наиболее распространенных и глубоко укоренившихся заблуждений в мире меломанов.

[Первая часть]

Частота 192 кГц считается вредной

Музыкальные цифровые файлы с частотой 192 кГц не приносят никакой выгоды, но всё же оказывают кое-какое влияние. На практике оказывается, что их качество воспроизведения немного хуже, а во время воспроизведения возникают ультразвуковые волны.

И аудиопреобразователи, и усилители мощности подвержены влиянию искажений, а искажения, как правило, быстро нарастают на высоких и низких частотах. Если один и тот же динамик воспроизводит ультразвук наряду с частотами из слышимого диапазона, то любая нелинейная характеристика будет сдвигать часть ультразвукового диапазона в слышимый спектр в виде неупорядоченных неконтролируемых нелинейных искажений, охватывающих весь слышимый звуковой диапазон. Нелинейность в усилителе мощности приведет к такому же эффекту. Эти эффекты трудно заметить, но тесты подтвердили, что оба вида искажений можно расслышать.

График выше показывает искажения, полученные в результате интермодуляции звука частотой 30 кГц и 33 кГц в теоретическом усилителе с неизменным коэффициентом нелинейных искажений (КНИ) около 0.09%. Искажения видны на протяжении всего спектра, даже на меньших частотах.

Неслышимые ультразвуковые волны способствуют интермодуляционным искажениям в слышимом диапазоне (светло-синяя зона). Системы, не предназначенные для воспроизведения ультразвука, обычно имеют более высокие уровни искажений, около 20 кГц, дополнительно внося вклад в интермодуляцию. Расширение диапазона частот для включения в него ультразвука требует компромиссов, которые уменьшат шум и активность искажений в пределах слышимого спектра, но в любом случае ненужное воспроизведение ультразвуковой составляющей ухудшит качество воспроизведения.

Есть несколько способов избежать дополнительных искажений:

Динамик, предназначенный только для воспроизведения ультразвука, усилитель и разделитель спектра сигнала, чтобы разделить и независимо воспроизводить ультразвук, который вы не можете слышать, чтобы он не влиял на другие звуки.
Усилители и преобразователи, спроектированные для воспроизведения более широкого спектра частот так, чтобы ультразвук не вызывал слышимых нелинейных искажений. Из-за дополнительных затрат и сложности исполнения, дополнительный частотный диапазон будет уменьшать качество воспроизведения в слышимой части спектра.
Качественно спроектированные динамики и усилители, которые совсем не воспроизводят ультразвук.
Для начала можно не кодировать такой широкий диапазон частот. Вы не можете (и не должны) слышать ультразвуковые нелинейные искажения в слышимой полосе частот, если в ней нет ультразвуковой составляющей.

Все эти способы нацелены на решение одной проблемы, но только 4 способ имеет какой-то смысл.

Если вам интересны возможности вашей собственной системы, то нижеследующие сэмплы содержат: звук частотой 30 кГц и 33 кГц в формате 24/96 WAV, более длинную версию в формате FLAC, несколько мелодий и нарезку обычных песен с частотой, приведенной к 24 кГц так, что они полностью попадают в ультразвуковой диапазон от 24 кГц до 46 кГц.

Тесты для измерения нелинейных искажений:

Звук 30 кГц + звук 33 кГц (24 бит / 96 кГц) [5-секундный WAV] [30-секундный FLAC]
Мелодии 26 кГц – 48 кГц (24 бит / 96 кГц) [10-секундный WAV]
Мелодии 26 кГц – 96 кГц (24 бит / 192 кГц) [10-секундный WAV]
Нарезка из песен, приведенных к 24 кГц (24 бит / 96 кГц WAV) [10-секундный WAV] (оригинальная версия нарезки) (16 бит / 44.1 кГц WAV)

Предположим, что ваша система способна воспроизводить все форматы с частотами дискретизации 96 кГц [6]. При воспроизведении вышеуказанных файлов, вы не должны слышать ничего, ни шума, ни свиста, ни щелчков или каких других звуков. Если вы слышите что-то, то ваша система имеет нелинейную характеристику и вызывает слышимые нелинейные искажения ультразвука. Будьте осторожны при увеличении громкости, если вы попадете в зону цифрового или аналогового ограничения уровня сигнала, даже мягкого, то это может вызвать громкий интермодуляционный шум.

В целом, не факт, что нелинейные искажения от ультразвука будут слышимы на конкретной системе. Вносимые искажения могут быть как незначительны, так и довольно заметны. В любом случае, ультразвуковая составляющая никогда не является достоинством, и во множестве аудиосистем приведет к сильному снижению качества воспроизведения звука. В системах, которым она не вредит, возможность обработки ультразвука можно сохранить, а можно вместо этого пустить ресурс на улучшение качества звучания слышимого диапазона.

Недопонимание процесса дискретизации

Теория дискретизации часто непонятна без контекста обработки сигналов. И неудивительно, что большинство людей, даже гениальные доктора наук в других областях, обычно не понимают её. Также неудивительно, что множество людей даже не осознают, что понимают её неправильно.

Дискретизированные сигналы часто изображают в виде неровной лесенки, как на рисунке выше (красным цветом), которая выглядит как грубое приближение к оригинальному сигналу. Однако такое представление является математически точным, и когда происходит преобразование в аналоговый сигнал, его график становится гладким (голубая линия на рисунке).

Наиболее распространенное заблуждение заключается в том, что, якобы, дискретизация – процесс грубый и приводит к потерям информации. Дискретный сигнал часто изображается как зубчатая, угловатая ступенчатая копия оригинальной идеально гладкой волны. Если вы так считаете, то можете считать, что чем больше частота дискретизации (и чем больше бит на отсчет), тем меньше будут ступеньки и тем точнее будет приближение. Цифровой сигнал будет все больше напоминать по форме аналоговый, пока не примет его форму при частоте дискретизации, стремящейся к бесконечности.

По аналогии, множество людей, не имеющих отношения к цифровой обработке сигналов, взглянув на изображение ниже, скажут: «Фу!» Может показаться, что дискретный сигнал плохо представляет высокие частоты аналоговой волны, или, другими словами, при увеличении частоты звука, качество дискретизации падает, и частотная характеристика ухудшается или становится чувствительной к фазе входного сигнала.

Это только так выглядит. Эти убеждения неверны!

Комментарий от 04.04.2013: В качестве ответа на всю почту, касательно цифровых сигналов и ступенек, которую я получил, покажу реальное поведение цифрового сигнала на реальном оборудовании в нашем видео Digital Show & Tell, поэтому можете не верить мне на слово.

Все сигналы частотой ниже частоты Найквиста (половина частоты дискретизации) в ходе дискретизации будут захвачены идеально и полностью, и бесконечно высокая частота дискретизации для этого не нужна. Дискретизация не влияет на частотную характеристику или фазу. Аналоговый сигнал может быть восстановлен без потерь – таким же гладким и синхронным как оригинальный.

С математикой не поспоришь, но в чем же сложности? Наиболее известной является требование ограничения полосы. Сигналы с частотами выше частоты Найквиста должны быть отфильтрованы перед дискретизацией, чтобы избежать искажения из-за наложения спектров. В роли этого фильтра выступает печально известный сглаживающий фильтр. Подавление помехи дискретизации, на практике, не может пройти идеально, но современные технологии позволяют подойти к идеальному результату очень близко. А мы подошли к избыточной дискретизации.

Избыточная дискретизация

Частоты дискретизации свыше 48 кГц не имеют отношения к высокой точности воспроизведения аудио, но они необходимы для некоторых современных технологий. Избыточная дискретизация (передискретизация) – наиболее значимая из них [7].

Идея передискретизации проста и изящна. Вы можете помнить из моего видео «Цифровое мультимедиа. Пособие для начинающих гиков», что высокие частоты дискретизации обеспечивают гораздо больший разрыв между высшей частотой, которая нас волнует (20 кГц) и частотой Найквиста (половина частоты дискретизации). Это позволяет пользоваться более простыми и более надежными фильтрами сглаживания и увеличить точность воспроизведения. Это дополнительное пространство между 20 кГц и частотой Найквиста, по существу, просто амортизатор для аналогового фильтра.

На рисунке выше представлены диаграммы из видео «Цифровое мультимедиа. Пособие для начинающих гиков», иллюстрирующие ширину переходной полосы для ЦАП или АЦП при частоте 48 кГц (слева) и 96 кГц (справа).

Это только половина дела, потому что цифровые фильтры имеют меньше практических ограничений в отличие от аналоговых, и мы можем завершить сглаживание с большей точностью и эффективностью. Высокочастотный необработанный сигнал проходит сквозь цифровой сглаживающий фильтр, который не испытывает проблем с размещением переходной полосы фильтра в ограниченном пространстве. После того, как сглаживание завершено, дополнительные дискретные отрезки в амортизирующем пространстве просто откидываются. Воспроизведение передискретизированного сигнала проходит в обратном порядке.

Это означает, что сигналы с низкой частотой дискретизации (44.1 кГц или 48 кГц) могут обладать такой же точностью воспроизведения, гладкостью АЧХ и низким уровнем наложений, как сигналы с частотой дискретизации 192 кГц или выше, но при этом не будет проявляться ни один из их недостатков (ультразвуковые волны, вызывающие интермодуляционные искажения, увеличенный размер файлов). Почти все современные ЦАП и АЦП производят избыточную дискретизацию на очень высоких скоростях, и мало кто об этом знает, потому что это происходит автоматически внутри устройства.

ЦАП и АЦП не всегда умели передискретизировать. Тридцать лет назад некоторые звукозаписывающие консоли использовали для звукозаписи высокие частоты дискретизации, используя только аналоговые фильтры. Этот высокочастотный сигнал потом использовался для создания мастер-дисков. Цифровое сглаживание и децимация (повторная дискретизация с более низкой частотой для CD и DAT) происходили на последнем этапе создания записи. Это могло стать одной из ранних причин, почему частоты дискретизации 96 кГц и 192 кГц стали ассоциироваться с производством профессиональных звукозаписей.

16 бит против 24 бит

Хорошо, теперь мы знаем, что сохранять музыку в формате 192 кГц не имеет смысла. Тема закрыта. Но что насчет 16-битного и 24-битного аудио? Что же лучше?

16-битное аудио с импульсно-кодовой модуляцией действительно не полностью покрывает теоретический динамический звуковой диапазон, который способен слышать человек в идеальных условиях. Также есть (и будут всегда) причины использовать больше 16 бит для записи аудио.

Ни одна из этих причин не имеет отношения к воспроизведению звука – в этой ситуации 24-битное аудио настолько же бесполезно, как и дискретизация на 192 кГц. Хорошей новостью является тот факт, что использование 24-битного квантования не вредит качеству звучания, а просто не делает его хуже и занимает лишнее место.

Примечания к Части 2

6. Многие из систем, которые неспособны воспроизводить сэмплы 96 кГц, не будут отказываться их воспроизводить, а будут незаметно субдискретизировать их до частоты 48 кГц. В этом случае звук не будет воспроизводиться совсем, и на записи ничего не будет, вне зависимости от степени нелинейности системы.

7. Передискретизация – не единственный способ работы с высокими частотами дискретизации в обработке сигналов. Есть несколько теоретических способов получить ограниченный по полосе звук с высокой частотой дискретизации и избежать децимации, даже если позже он будет субдискретизирован для записи на диски. Пока неясно, используются ли такие способы на практике, поскольку разработки большинства профессиональных установок держатся в секрете.

8. Неважно, исторически так сложилось или нет, но многие специалисты сегодня используют высокие разрешения, потому что ошибочно полагают, что звук с сохраненным содержимым за пределами 20 кГц звучит лучше. Прямо как потребители.

[Часть 3]

Эту статью прочитали 149 317 раз

Статья входит в разделы:Интересное о звуке

Почитать еще:

Обсуждение данного материала

11 марта 2025, 18:39

Роман (Гость)

Автор любит mp3 96kHz &?

Ответить

22 февраля 2025, 16:30

Serge (Гость)

По-моему, статью написал непрофессионал или человек, имеющий корыстные мотивы. На мой скромный взгляд, передискретизация необходима, но не потому, что позволяет сохранить более широкий частотный диапазон звука (все равно большинство людей слышат в среднем не выше 18 кГц, кто не верит - пусть сделает себе в поликлинике аудиограмму), а для того, чтобы "отодвинуть" повторяющиеся копии спектра дискретизированного сигнала подальше вверх от слышимого частотного диапазона. Это существенно облегчает работу сглаживающего ФНЧ, позволяя ему более качественно, без "звона" и других издержек, снижать до приемлемого уровня эти повторяющиеся копии спектра. В результате звуки в слышимом диапазоне (до 20 кГц) воспроизводятся более мягко, естественно и детально, без остатков ультразвуковой "грязи", что обычно имеет место при штатных частотах дискретизации CD (44,1 кГц), когда сглаживающий ФНЧ вынужден отработать в условиях очень узкой полосы - 20 кГц ... 22,05 кГц. Далее, насчет бесполезности высокой битности квантования, о чем неаргументированно сказано в статье. При битности 16 обеспечивается диапазон 96 дБ (примерно по 6 дБ на 1 бит). На первый взгляд, 96 дБ - предостаточно, но это только для сигналов с амплитудами, близкими к максимальным. Для представления же сигналов в нижней части динамического диапазона (ниже 50 дБ ... 55 дБ) остается порядка не более 40 дБ ... 45 дБ, а это всего порядка 6-7 бит.

Ответить

5 августа 2022, 10:47

Валерий (Гость)

Авто статьи слушает музыку на китайских компьютерных колонках) слепому не покажешь, глухому не расскажешь)))

Ответить

5 декабря 2022, 08:09

Волькарган (Гость)

Слеп и глух

Когда слепой тест пройдешь, тогда и поговорим . Пока никто не прошел

Ответить

20 августа 2023, 13:24

Андрей (Гость)

Скажем так - чтобы услышать звук с хорошего источника, нужен хороший получатель. Как в виде правильной акустики, так и в виде имеющего правильные уши слушателя. Если где-то что-то пошло не так, то конечно смысла в 192 нет.

Ответить

18 июля 2022, 15:35

Vadz (Гость)

исходник в формате 24 бита 96 кгц 1500 кбпс имеет в себе данных больше чем мы способны услышать. Предпочтительней будет заиметь просто дурную хай энд аккустику

Ответить

3 февраля 2022, 22:06

Олег (Гость)

магнитола alpine iva310 слушаем CD и DVD AUDIO 192kHz разница ощутима

Ответить

5 декабря 2020, 02:05

Георгий (Гость)

Все эти выводы базируются на мысли о том, что звуковой мир заканчивается на 20кГц, а это не так.

Ответить

19 августа 2021, 09:02

Максим (Гость)

Не так только для недоаудиофилов!

Ответить

6 сентября 2019, 12:04

Александр (Гость)

96000 / 24

Я заметил, что для оцифровки граммпластинок недостаточно дискретизации 48000Гц. Если представить спектр линейным вертикальным вектором, то исходный частотный диапазон получается шире на треть всегда, в ряде случаев на половину, чем граничные 24000 Кгц. Сигнал за этим пределом всегда достаточно слабый, но его отсутствие обедняет слышимые высокие и средние частоты. Обусловлено это срезом обертонов. 192 определённо избыточен, но 48000 явно не достаточно, о чем говорит возврат моды на винил.

Ответить

2 июня 2020, 19:50

Денис (Гость)

Возврат моды на винил - это фетишизм в большей степени, чем аудиофилия. Запиленные пласты прям идеально передают звук.
Я предпочитаю слушать оцифровки (их не заездишь), а пластинки остаются как ламповый ритуал и предмет коллекционирования

Ответить

2 декабря 2020, 20:40

Платон (Гость)

Самый верный это цифровой звук. Потому как не претерпевает вносимых трактами искажений.
Винил на самом деле самый худший вариант в плане исходного сигнала на мастер ленте и выходного с ЛП.
Да винил звучит красиво, не спорю, на хорошей аппаратуре. Но он вносит свои коррективы в сигнал т.е искажает его.
Вот только представьте себе, как минимум с начало звук сводят на мастер ленту искажения 1, нарезается на мастер-болванку искажения 2, потом металлизируется искажения 4 и далее штампуется искажения 4.
При воспроизведении игла вносит свои дополнительные звуки. Хотя я сам имею коллекцию рипов с винила и слушаю с удовольствием. предпочитаю 192 кГц.

Ну а катушки и средства для их записи и воспроизведения обычно вызывают у аудиофилов сильную привязанность, которая связана не только с тем, что они обеспечивают великолепное качество звука, но и с тем, что требуют к себе много внимания. А уж что говорить о внешнем виде работающего магнитофона со светящимися стрелочными индикаторами и клавишами!

Ответить

7 ноября 2023, 19:22

Александр (Гость)

Возьмите MY Love с Red Rose и прослушайте на оригинальном виниле. Первые аккорды и хрустальный звук тарелочек, придающий такое очарование звучанию в гармонии с мягким обволакивающим басом. И потом любую оцифровку, где тарелочки еле слышны и они не имеют прозрачности, в лучшем случае. Про голос на цифре я , кроме ----- ничего сказать не могу. Кто слушал Уитни Хьюстон на оригинальном виниле на CD её просто невозможно слушать. На виниле мощь голоса, полный динамический диапазон, а на CD как в подушку .

Ответить

Написать свой комментарий