Современные методы позиционирования и сжатия звука
искажения переносимой информации. Увеличение объема EDC/ECC относительно
объема исходной информации в общем случае повышает обнаруживающую и
корректирующую способность этих кодов.
В качестве EDC популярен циклический избыточный код CRC (Cyclic
Redundancy Check), суть которого состоит в сложном перемешивании исходной
информации в блоке и формированию коротких двоичных слов, разряды которых
находятся в сильной перекрестной зависимости от каждого бита блока.
Изменение даже одного бита в блоке вызывает значительное изменение
вычисленного по нему CRC, и вероятность такого искажения битов, при котором
CRC не изменится, исчезающе мала даже при коротких (единицы процентов от
длины блока) словах CRC. В качестве ECC используются коды Хэмминга
(Hamming) и Рида-Соломона (Reed-Solomon), которые также включают в себя и
функции EDC.
Информационная избыточность несущего цифрового сигнала приводит к
значительному (на порядок и более) расширению полосы частот, требуемой для
его успешной передачи, по сравнению с передачей исходного сигнала в
аналоговой форме. Кроме собственно информационной избыточности, к
расширению полосы приводит необходимость сохранения достаточно крутых
фронтов цифровых импульсов.
Кроме целей помехозащиты, информация в цифровом сигнале может быть
подвергнута также линейному или канальному кодированию, задача которого -
оптимизировать электрические параметры сигнала (полосу частот, постоянную
составляющую, минимальное и максимальное количество нулевых/единичных
импульсов в серии и т.п.) под характеристики реального канала передачи или
записи сигнала.
Полученный несущий сигнал, в свою очередь, также является обычным
электрическим сигналом, и к нему применимы любые операции с такими
сигналами - передача по кабелю, усиление, фильтрование, модуляция, запись
на магнитный, оптический или другой носитель и т.п. Единственным
ограничением является сохранение информационного содержимого - так, чтобы
при последующем анализе можно было однозначно выделить и декоди- ровать
переносимую информацию, а из нее - исходный сигнал.
Способы представления звука в цифровом виде
Исходная форма звукового сигнала - непрерывное изменение амплитуды во
времени - представляется в цифровой форме с помощью "перекрестной
дискретизации" - по времени и по уровню.
Согласно теореме Котельникова, любой непрерывный процесс с ограниченным
спектром может быть полностью описан дискретной последовательностью его
мгновенных значений, следующих с частотой, как минимум вдвое превышающей
частоту наивысшей гармоники процесса; частота Fd выборки мгновенных
значений (отсчетов) называется частотой дискретизации.
Из теоремы следует, что сигнал с частотой Fa может быть успешно
дискретизирован по времени на частоте 2Fa только в том случае, если он
является чистой синусоидой, ибо любое отклонение от синусоидальной формы
приводит к выходу спектра за пределы частоты Fa. Таким образом, для
временнОй дискретизации произвольного звукового сигнала (обычно имеющего,
как известно, плавно спадающий спектр), необходим либо выбор частоты
дискретизации с запасом, либо принудительное ограничение спектра входного
сигнала ниже половины частоты дискретизации.
Одновременно с временнОй дискретизацией выполняется амплитудная -
измерение мгновенных значений амплитуды и их представление в виде числовых
величин с определенной точностью. Точность измерения (двоичная разрядность
N получаемого дискретного значения) определяет соотношение сигнал/шум и
динамический диапазон сигнала (теоретически это - взаимно-обратные
величины, однако любой реальный тракт имеет также и собственный уровень
шумов и помех).
Полученный поток чисел (серий двоичных цифр), описывающий звуковой
сигнал, называют импульсно-кодовой модуляцией или ИКМ (Pulse Code
Modulation, PCM), так как каждый импульс дискретизованного по времени
сигнала представляется собственным цифровым кодом.
Чаще всего применяют линейное квантование, когда числовое значение
отсчета пропорционально амплитуде сигнала. Из-за логарифмической природы
слуха более целесообразным было бы логарифмическое квантование, когда
числовое значение пропорционально величине сигнала в децибелах, однако это
сопряжено с трудностями чисто технического характера.
ВременнАя дискретизация и амплитудное квантование сигнала неизбежно
вносят в сигнал шумовые искажения, уровень которых принято оценивать по
формуле 6N + 10lg (Fдискр/2Fмакс) + C (дБ), где константа C варьируется для
разных типов сигналов: для чистой синусоиды это 1.7 дБ, для звуковых
сигналов - от -15 до 2 дБ. Отсюда видно, что к снижению шумов в рабочей
полосе частот 0..Fмакс приводит не только увеличение разрядности отсчета,
но и повышение частоты дискретизации относительно 2Fмакс, поскольку шумы
квантования "размазываются" по всей полосе вплоть до частоты дискретизации,
а звуковая информация занимает только нижнюю часть этой полосы.
В большинстве современных цифровых звуковых систем используются
стандартные частоты дискретизации 44.1 и 48 кГц, однако частотный диапазон
сигнала обычно ограничивается возле 20 кГц для оставления запаса по
отношению к теоретическому пределу. Также наиболее распространено 16-
разрядное квантование по уровню, что дает предельное соотношение сигнал/шум
около 98 дБ. В студийной аппаратуре используются более высокие разрешения -
18-, 20- и 24-разрядное квантование при частотах дискретизации 56, 96 и 192
кГц. Это делается для того, чтобы сохранить высшие гармоники звукового
сигнала, которые непосредственно не воспринимаются слухом, но влияют на
формирование общей звуковой картины.
Для оцифровки более узкополосных и менее качественных сигналов частота
и разрядность дискретизации могут снижаться; например, в телефонных линиях
применяется 7- или 8-разрядная оцифровка с частотами 8..12 кГц.
Представление аналогового сигнала в цифровом виде называется также
импульсно-кодовой модуляцией (ИКМ, PCM - Pulse Code Modulation), так как
сигнал представляется в виде серии импульсов постоянной частоты (временнАя
дискретизация), амплитуда которых передается цифровым кодом (амплитудная
дискретизация). PCM-поток может быть как параллельным, когда все биты
каждого отсчета передаются одновременно по нескольким линиям с частотой
дискретизации, так и последовательным, когда биты передаются друг за другом
с более высокой частотой по одной линии.
Сам цифровой звук и относящиеся к нему вещи принято обозначать общим
термином Digital Audio; аналоговая и цифровая части звуковой системы
обозначаются терминами Analog Domain и Digital Domain.
АЦП и ЦАП
Аналогово-цифровой и цифро-аналоговый преобразователи. Первый преобразует
аналоговый сигнал в цифровое значение амплитуды, второй выполняет обратное
преобразование. В англоязычной литературе применяются термины ADC и DAC, а
совмещенный преобразователь называют codec (coder-decoder).
Принцип работы АЦП состоит в измерении уровня входного сигнала и выдаче
результата в цифровой форме. В результате работы АЦП непрерывный аналоговый
сигнал превращается в импульсный, с одновременным измерением амплитуды
каждого импульса. ЦАП получает на входе цифровое значение амплитуды и
выдает на выходе импульсы напряжения или тока нужной величины, которые
расположенный за ним интегратор (аналоговый фильтр) превращает в
непрерывный аналоговый сигнал.
Для правильной работы АЦП входной сигнал не должен изменяться в течение
времени преобразования, для чего на его входе обычно помещается схема
выборки-хранения, фиксирующая мгновенный уровень сигнала и сохраняющая его
в течение всего времени преобразования. На выходе ЦАП также может
устанавливаться подобная схема, подавляющая влияние переходных процессов
внутри ЦАП на параметры выходного сигнала.
При временнОй дискретизации спектр полученного импульсного сигнала в
своей нижней части 0..Fa повторяет спектр исходного сигнала, а выше
содержит ряд отражений (aliases, зеркальных спектров), которые расположены
вокруг частоты дискретизации Fd и ее гармоник (боковые полосы). При этом
первое отражение спектра от частоты Fd в случае Fd = 2Fa располагается
непосредственно за полосой исходного сигнала, и требует для его подавления
аналогового фильтра (anti-alias filter) с высокой крутизной среза. В АЦП
этот фильтр устанавливается на входе, чтобы исключить перекрытие спектров и
их интерференцию, а в ЦАП - на выходе, чтобы подавить в выходном сигнале
надтональные помехи, внесенные временнОй дискретизацией.
Устройство АЦП и ЦАП
В основном применяется три конструкции АЦП: параллельные - входной
сигнал одновременно сравнивается с эталонными уровнями набором схем
сравнения (компараторов), которые формируют на выходе двоичное значение. В
таком АЦП количество компараторов равно (2 в степени N) - 1, где N -
разрядность цифрового кода (для восьмиразрядного - 255), что не позволяет
наращивать разрядность свыше 10-12.
последовательного приближения - преобразователь при помощи
вспомогательного ЦАП генерирует эталонный сигнал, сравниваемый со входным.
Эталонный сигнал последовательно изменяется по принципу половинного деления
(дихотомии), который используется во многих методах сходящегося поиска
прикладной математики. Это позволяет завершить преобразование за количество
тактов, равное разрядности слова, независимо от величины входного сигнала.
с измерением временнЫх интервалов - широкая группа АЦП, использующая
для измерения входного сигнала различные принципы преобразования уровней в
пропорциональные временнЫе интервалы, длительность которых измеряется при
помощи тактового генератора высокой частоты. Иногда называются также
считающими АЦП.
Среди АЦП с измерением временнЫх интервалов преобладают следующие три
типа: последовательного счета, или однократного интегрирования (single-
slope) - в каждом такте преобразования запускается генератор линейно
возрастающего напряжения, которое сравнивается со входным.
Обычно такое напряжение получают на вспомогательном ЦАП, подобно АЦП
последовательного приближения.
двойного интегрирования (dual-slope) - в каждом такте преобразования
входной сигнал заряжает конденсатор, который затем разряжается на источник
опорного напряжения с измерением длительности разряда.
следящие - вариант АЦП последовательного счета, при котором генератор
эталонного напряжения не перезапускается в каждом такте, а изменяет его от
предыдущего значения до текущего.
Наиболее популярным вариантом следящего АЦП является sigma-delta,
работающий на частоте Fs, значительно (в 64 и более раз) превышающей
частоту дискретизации Fd выходного цифрового сигнала. Компаратор такого АЦП
выдает значения пониженной разрядности (обычно однобитовые - 0/1), сумма
которых на интервале дискретизации Fd пропорциональна величине отсчета.
Последовательность малоразрядных значений подвергается цифровой фильтрации
и понижению частоты следования (decimation), в результате чего получается
серия отсчетов с заданной разрядностью и частотой дискретизации Fd.
Для улучшения соотношения сигнал/шум и снижения влияния ошибок
квантования, которое в случае однобитового преобразователя получается
довольно высоким, применяется метод формовки шума (noise shaping) через
схемы обратной связи по ошибке и цифрового фильтрования. В результате
применения этого метода форма спектра шума меняется так, что основная
шумовая энергия вытесняется в область выше половины частоты Fs,
незначительная часть остается в нижней половине, и практически весь шум
удаляется из полосы исходного аналогового сигнала.
ЦАП в основном строятся по трем принципам: взвешивающие - с
суммированием взвешенных токов или напряжений, когда каждый разряд входного
слова вносит соответствующий своему двоичному весу вклад в общую величину
получаемого аналогового сигнала; такие ЦАП называют также параллельными или
многоразрядными (multibit).
sigma-delta, с предварительной цифровой передискретизацией и выдачей
малоразрядных (обычно однобитовых) значений на схему формирования
эталонного заряда, которые со столь же высокой частотой добавляются к
выходному сигналу. Такие ЦАП носят также название bitstream.
с широтно-импульсной модуляцией (ШИМ, Pulse Width Modulation, PWM),
когда на схему выборки-хранения аналогового сигнала выдаются импульсы
постоянной амплитуды и переменной длительности, управляя дозированием
выдаваемого на выход заряда. На этом принципе работают преобразователи MASH
(Multi-stAge Noise Shaping - многостадийная формовка шума) фирмы
Matsushita. Свое название эти ЦАП получили по причине применения в них
нескольких последовательных формирователей шума.
При использовании передискретизации в десятки раз (обычно - 64x..512x)
становится возможным уменьшить разрядность ЦАП без ощутимой потери качества
сигнала; ЦАП с меньшим числом разрядов обладают также лучшей линейностью. В
пределе количество разрядов может сокращаться до одного.
Форма выходного сигнала таких ЦАП представляет собой полезный сигнал,
обрамленный значительным количеством высокочастотного шума, который, тем не
менее, эффективно подавляется аналоговым фильтром даже среднего качества.
ЦАП являются "прямыми" устройствами, в которых преобразование
выполняется проще и быстрее, чем в АЦП, которые в большинстве своем -
последовательные и более медленные устройства.
Передискретизация (oversampling)
Это дискретизация сигнала с частотой, превышающей основную частоту
дискретизации. Передискретизации может быть аналоговой, когда с повышенной
частотой делаются выборки исходного сигнала, или цифровой, когда между уже
существующими цифровыми отсчетами вставляются дополнительные, рассчитанные
путем интерполяции. Другой способ получения значений промежуточных отсчетов
состоит во вставке нулей, после чего вся последовательность подвергается
цифровой фильтрации. В АЦП используется аналоговая передискретизация, в ЦАП
- цифровая.
Передискретизация используется для упрощения конструкций АЦП и ЦАП. По
условиям задачи на входе АЦП и выходе ЦАП должен быть установлен аналоговый
фильтр с АЧХ, линейной в рабочем диапазоне и круто спадающей за его
пределами. Реализация такого аналогового фильтра весьма сложна; в то же
время при повышении частоты дискретизации вносимые ею отражения спектра
пропорционально отодвигаются от основного сигнала, и аналоговый фильтр
может иметь гораздо меньшую крутизну среза.
Другое преимущество передискретизации состоит в том, что ошибки
амплитудного квантования (шум дробления), распределенные по всему спектру
квантуемого сигнала, при повышении частоты дискретизации распределяются по
более широкой полосе частот, так что на долю основного звукового сигнала
приходится меньшее количество шума. Каждое удвоение частоты снижает уровень
шума квантования на 3 дБ; поскольку один двоичный разряд эквивалентен 6 дБ
шума, каждое учетверение частоты позволяет уменьшить разрядность
преобразователя на единицу.
Передискретизация вместе с увеличением разрядности отсчета,
интерполяцией отсчетов с повышенной точностью и выводом их на ЦАП
надлежащей разрядности позволяет несколько улучшить качество восстановления
звукового сигнала. По этой причине даже в 16-разрядных системах нередко
применяются 18- и 20-разрядные ЦАП с передискретизацией.
АЦП и ЦАП с передискретизацией за счет значительного уменьшения времени
преобразования могут обходиться без схемы выборки-хранения.
Достоинства и недостатки цифрового звука
Цифровое представление звука ценно прежде всего возможностью
бесконечного хранения и тиражирования без потери качества, однако
преобразование из аналоговой формы в цифровую и обратно все же неизбежно
приводит к частичной его потере. Наиболее неприятные на слух искажения,
вносимые на этапе оцифровки - гранулярный шум, возникающий при квантовании
сигнала по уровню из-за округления амплитуды до ближайшего дискретного
значения. В отличие от простого широкополосного шума, вносимого ошибками
квантования, гранулярный шум представляет собой гармонические искажения
сигнала, наиболее заметные в верхней части спектра.
Мощность гранулярного шума обратно пропорциональна количеству ступеней
квантования, однако из-за логарифмической характеристики слуха при линейном
квантовании (постоянная величина ступени) на тихие звуки приходится меньше
ступеней квантования, чем на громкие, и в результате основная плотность
нелинейных искажений приходится на область тихих звуков. Это приводит к
ограничению динамического диапазона, который в идеале (без учета
гармонических искажений) был бы равен соотношению сигнал/шум, однако
необходимость ограничения этих искажений снижает динамический диапазон для
16-разрядного кодирования до 50-60 дБ.
Положение могло бы спасти логарифмическое квантование, однако его
реализация в реальном времени весьма сложна и дорога.
Искажения, вносимые гранулярным шумом, можно уменьшить путем добавления
к сигналу обычного белого шума (случайного или псевдослучайного сигнала),
амплитудой в половину младшего значащего разряда; такая операция называется
сглаживанием (dithering). Это приводит к незначительному увеличению уровня
шума, зато ослабляет корреляцию ошибок квантования с высокочастотными
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28
|