Современные методы позиционирования и сжатия звука
магнитных носителей этот срок оценивается в несколько лет). Правильно
переданная или обновленная цифровая сигналограмма качества не теряет и
может копироваться и существовать вечно в абсолютно неизменном виде.
Тем не менее, не следует забывать, что корректирующая способность
любого кода конечна, а реальные носители далеки от идеальных, поэтому
возникновение неисправимых ошибок - на такая уж редкая вещь, особенно при
неаккуратном обращении с носителем. При чтении с новых и правильно хранимых
DAT-кассет или компакт-дисков в качественных и надежных аппаратах таких
ошибок практически не возникает, однако при старении, загрязнении и
повреждении носителей и считывающих систем их становится больше. Одиночная
неисправленная ошибка почти всегда незаметна на слух благодаря
интерполяции, однако она приводит к искажению формы исходного звукового
сигнала, а накопление таких ошибок со временем начинает ощущаться и на
слух.
Отдельную проблему составляет сложность регистрации неисправленных
ошибок, а также проверки идентичности оригинала и копии. Чаще всего
конструкторы цифровых звуковых устройств, работающих в реальном времени, не
озабочены вопросом точной проверки достоверности передачи, считая вполне
достаточными меры, принятые для коррекции ошибок. Невозможность в общем
случае повторной передачи ошибочного отсчета или блока приводит к тому, что
интерполяция происходит скрытно и после копирования нельзя с уверенностью
сказать, точно ли скопирован исходный сигнал. Индикаторы ошибки, имеющиеся
в ряде устройств, обычно включаются только в момент ее возникновения, и в
случае одиночных ошибок их срабатывание легко может остаться незамеченным.
Даже в системах на основе персональных компьютеров чаще всего нет
возможности контролировать правильность приема по цифровому интерфейсу или
прямого считывания CD; выходом является только многократное повторение
операции и сравнение результатов.
И наконец, в принципе возможны ситуации, когда даже незначительные
ошибки способны необратимо исказить передаваемую информацию, оставшись при
этом незамеченными системой передачи. Другое дело, что вероятность
возникновения подобных ошибок исчезающе мала (порядка одной на несколько
лет непрерывной передачи сигнала), поэтому такую возможность практически
нигде не принимают в расчет.
К вопросу о сохранении качества сигнала при цифровой обработке
Прежде всего, необходимо различать "искажающие" и "неискажающие" виды
обработки. К первым относятся операции, изменяющие форму и структуру
сигнала - смешивание, усиление, фильтрация, модуляция и т.п., ко вторым -
операции монтажа (вырезка, вклейка, наложение) и переноса (копирования).
Качество сигнала может страдать только при "искажающей" обработке,
причем любой - и аналоговой, и цифровой. В первом случае это происходит в
результате внесения шумов, гармонических, интермодуляционных и других
искажений в узлах аналогового тракта, во втором - благодаря конечной
точности квантования сигнала и математических вычислений. Все цифровые
вычисления выполняются в некоторой разрядной сетке фиксированной длины -
16, 20, 24, 32, 64, 80 и более бит; увеличение разрядности сетки повышает
точность вычислений и уменьшает ошибки округления, однако в общем случае не
может исключить их полностью. Конечная точность квантования первичного
аналогового сигнала приводит к тому, что даже при абсолютно точной
обработке полученного цифрового сигнала квантованное значение каждого
отсчета все равно отличается от своего идеального значения. Для минимизации
искажений при обработке в студиях предпочитают обрабатывать и хранить
сигналограммы на мастер-носителях с повышенным разрешением (20, 24 или 32
разряда), даже если результат будет тиражироваться на носителе с меньшим
разрешением.
Кроме собственно ошибок вычислений и округления, на точность сильно
влияет выбор представления числовых отсчетов сигнала при обработке.
Традиционное представление PCM с так называемой фиксированной точкой
(fixed point), когда отсчеты представляются целыми числами, наиболее удобно
и влечет минимум накладных расходов, однако точность вычислений зависит от
масштаба операций - например, при умножении образуются числа вдвое большей
разрядности, которые потом приходится приводить обратно к разрядности
исходных отсчетов, а это может привести к переполнению разрядной сетки.
Компромиссным вариантом служит промежуточное увеличение разрядности
отсчетов (например, 16->32), что снижает вероятность переполнения, однако
требует большей вычислительной мощности, объема памяти и вносит
дополнительные искажения при обратном понижении разрядности. Кроме того,
снижению погрешности способствует правильный выбор последовательности
коммутативных (допускающих перестановку) операций, группировка
дистрибутивных операций, учет особенностей работы конкретного процессора и
т.п.
Другим способом увеличения точности является преобразование отсчетов в
форму с плавающей точкой (floating point) с разделением на значащую часть -
мантиссу и показатель величины - порядок. В этой форме все операции
сохраняют разрядность значащей части, и умножение не приводит к
переполнению разрядной сетки. Однако, как само преобразование между формами
с фиксированной и плавающей точкой, так и вычисления в этой форме требуют
на порядки большего быстродействия процессора, что сильно затрудняет их
использование в реальном времени.
Несмотря на то, что качество сигнала неизбежно, хоть и незначительно,
ухудшается при любой "искажающей" цифровой обработке, некоторые операции
при определенных условиях являются полностью и однозначно обратимыми.
Например, усиление сигнала по амплитуде в три раза заключается в
умножении каждого отсчета на три; если эта операция выполнялась с
фиксированной точкой и при этом не возникло переполнения, с помощью деления
на три потом можно будет вернуть все отсчеты в исходное состояние, тем
самым полностью восстановив первоначальное состояние сигнала. И в то же
время после умножения каждый отсчет окажется увеличенным точно в три раза,
поэтому ошибка относительно исходного аналогового сигнала, внесенная при
квантовании, также увеличится в среднем в три раза, тем самым ухудшив общее
качество сигнала.
Сказанное выше демонстрирует, что ухудшение качества при "искажающей"
цифровой обработке совсем не обязательно накапливается со временем, хотя в
большинстве реальных применений происходит именно так. Кроме того, это не
означает, что любая операция цифрового усиления всегда будет однозначно
обратимой - это зависит от многих особенностей применения операции. Тем не
менее, грамотно и качественно реализованная цифровая обработка может давать
существенно меньший уровень искажений, чем такая же аналоговая, разве что
это будут искажения разных видов.
К вопросу о сохранении качества сигнала при цифровом преобразовании
форматов
Только в том случае, когда в процессе преобразования применяются
"искажающие" операции - изменение разрядности отсчета, частоты
дискретизации, фильтрование, сжатие с потерями и т.п. Простое увеличение
разрядности отсчета с сохранением частоты дискретизации будет неискажающим,
однако такое же увеличение, сопряженное с применением сглаживающей функции
- уже нет. Уменьшение разрядности отсчета всегда является искажающей
операцией, кроме случая, когда преобразуемые отсчеты были получены таким же
простым увеличением разрядности - равной или меньшей.
Многие форматы отличаются друг от друга только порядком битов в слове,
отсчетов левого и правого каналов в потоке и служебной информацией -
заголовками, контрольными суммами, помехозащитными кодами и т.п. Точный
способ проверки неискажаемости сигнала заключается в преобразовании
нескольких различных потоков (файлов) формата F1 в формат F2, а затем
обратно в F1. Если информационная часть каждого потока (файла) при этом
будет идентична исходной - данный вид преобразования можно считать
неискажающим.
Под информационной частью потока (файла) понимается собственно набор
данных, описывающих звуковой сигнал; остальная часть считается служебной и
на форму сигнала в общем случае не влияет. Например, если в служебной части
файла или потока предусмотрено поле для времени его создания (передачи), то
даже в случае полного совпадения информационных частей двух разных файлов
или потоков их служебные части окажутся различными, и это будет
зафиксировано логическим анализатором в случае потока или программой
побайтного сравнения - в случае файла. Кроме этого, временной сдвиг одного
сигнала относительно другого, возникающий при выравнивании цифрового потока
по границам слов или блоков и состоящий в добавлении нулевых отсчетов в
начало и/или конец файла или потока, также приводит к их кажущемуся
цифровому несовпадению. В таких ситуациях для проверки идентичности
цифровых сигналов необходимо пользоваться специальной аппаратурой или
программой.
Для "перегонки" звука между специализированными системами, имеющими
совместимые цифровые интерфейсы, достаточно соединить их цифровым кабелем и
переписать звук с одной системы на другую; в ряде сочетаний устройств при
этом возможно ухудшение качества сигнала из-за уменьшения разрядности
отсчета, передискретизации или сжатия звука. Например, при копировании
звука между одинаковыми системами MiniDisk через интерфейс S/PDIF сжатый
звуковой поток на передающей стороне подвергается восстановлению, а на
приемной - повторному сжатию. Вследствие несимметричности алгоритма ATRAC в
звук при повторном сжатии будут внесены добавочные искажения.
Для преобразования компьютерного файла в другой формат используются
программы-конверторы: WAV2AIFF/AIFF2WAV, Convert, AWave и другие - на IBM
PC, SoundExtractor, SampleEditor, BST - на Apple Macintosh.
Обмен звуковой информацией между компьютерной и специализированной
системой нередко возможен несколькими способами: Прямой перенос по
цифровому интерфейсу, если у обоих систем имеются совместимые цифровые
интерфейсы. При этом на компьютерной системе используется программа
записи/воспроизведения, формирующая или воспроизводящая стандартный для
данной системы звуковой файл.
Чтение/запись на специализированных системах стандартных компьютерных
носителей. Например, ряд музыкальных рабочих станций использует гибкие
диски в форматах стандартных файловых систем IBM PC или Macintosh, либо
позволяет прочитать или создать такой диск.
Чтение и запись на компьютерной системе специализированных носителей и
их специальных форматов, если это позволяет аппаратура и программное
обеспечение. Таким образом читаются и пишутся дискеты от Ensoniq, AKAI,
Emulator, компакт-диски ряда "чужих" систем, а также читаются и пишутся
обычные звуковые компакт-диски.
Компьютерные программы, используемые для обработки звука
На IBM PC наиболее популярны редакторы Cool Edit Pro (Syntrillium)
Sound Forge (Sonic Foundry), WaveLab (Steinberg) и системы многодорожечной
записи SAW Plus, Samplitude, N-Track и DDClip. На Apple Macintosh
используются программ Alchemy, Deck II, DigiTracks, HyperPrism.
Сейчас популяpны пpогpаммы Cool Editor, Sound Forge, Samplitude,
Software Audio Workshop (SAW). Они дают возможность пpосматpи- вать
осциллогpаммы обоих стеpеоканалов, пpослушивать выбpанные участки, делать
выpезки и вставки, амплитудные и частотные пpеобpазования, звуковые эффекты
(эхо, pевеpбеpацию, фленжеp, дистошн), наложение дpугих оцифpовок,
изменение частоты оцифpовки, генеpиpовать pазличные виды шумов,
синтезиpовать звук по адди- тивному и FM методам и т.п. Cool Editor
содеpжит спектpальный анализатоp, отобpажающий спектp выбpанного участка
оцифpовки.
Многие пpогpаммы обpаботки звука позволяют загpужать и сохpанять
оцифpовки в pазличных фоpматах, что дает возможность пpеобpазовывать файлы
из одного фоpмата в дpугой и pазделять стеpеоканалы.
Джиттер
Jitter - дрожание (быстрые колебания) фазы синхросигналов в цифровых
системах, приводящее к неравномерности во времени моментов срабатывания
тактируемых этими сигналами цифровых устройств. Сами по себе цифровые
устройства нечувствительны к таким колебаниям, пока они не достигают
значительной величины по сравнению с общей длительностью импульсов, однако
в "пограничных" устройствах, находящихся на стыке цифровой и аналоговой
частей схемы - АЦП и ЦАП - джиттер приводит к неравномерности моментов
срабатывания компараторов АЦП или ключей ЦАП, приводящей к нарушению
правильности формы аналогового сигнала. Для высокочастотных компонент
сигнала дрожание фазы приводит к "размыванию" звука - нарушению
субъективной пространственной локализации источников, поскольку слуховое
восприятие локализации базируется в основном на фазовых, а не на
амплитудных соотношениях стереоканалов.
Джиттер может возникать из-за любой нестабильности напряжений и токов в
области ЦАП/АЦП. Например, колебания питающих напряжений изменяют частоту
опорного генератора, наводки на провода и печатные дорожки искажают форму
цифровых сигналов. Даже если эти искажения не изменяют информационного
содержимого сигнала - заключенной в нем битовой последовательности, они
могут нарушить равномерность опроса входного звукового сигнала в АЦП или
выдачу выходного сигнала с ЦАП и привести к искажениям формы, особенно
заметной в области высоких частот.
Величина джиттера обозначает максимальное абсолютное отклонение момента
перехода тактового сигнала из одного состояния в другое от расчетного
значения, и измеряется в секундах. Для систем среднего качества допустимая
величина джиттера составляет порядка 100 пикосекунд, для систем класса Hi-
Fi ее стараются предельно минимизировать.
Для борьбы с джиттером используется тактирование АЦП и ЦАП
высокостабильными генераторами, а для подавления неравномерности цифрового
потока, поступающего на ЦАП - промежуточными буферами типа FIFO (очередь).
Для уменьшения влияния помех применяются обычные методы - экранирование,
развязки, исключение "земляных петель", раздельные источники питания,
питание критичных схем от аккумулятора и т.п. Хорошие результаты дают
внешние модули ЦАП, в которых реализованы описанные методы - например,
Audio Alchemy DAC-in-the-Box и другие.
Необходимо различать "пограничный" джиттер, действующий на границах
аналоговой и цифровой части схемы - в области АЦП или ЦАП, и "внутренний",
возникающий в любых других участках чисто цифровой схемы.
Влияние на звуковой сигнал имеет только "пограничный" джиттер, ибо
только он непосредственно связан с преобразованием аналогового звукового
сигнала. Весь "внутренний" джиттер при грамотном построении схемы должен
полностью подавляться в интерфейсных цепях, однако некорректная реализация
может пропускать его и непосредственно на ЦАП/АЦП.
Возникающий в цепях формирования, обработки, передачи, записи и чтения
цифровых сигналов "внутренний" джиттер вполне может распространяться по
системе, выходить за ее пределы и переноситься между системами через
цифровые интерфейсы передачи или цифровые же носители информации. При этом
величина джиттера может как ослабляться, так и усиливаться. При
использовании интерфейсов передачи со "встроенным" (embedded)
синхросигналом, а также при чтении с любого носителя, приемная сторона
вынуждена синхронизироваться с передатчиком путем использования систем
фазовой автоподстройки частоты (ФАПЧ, Phase Locked Loop - PLL), которая
вносит дополнительные дрожания, будучи не в состоянии мгновенно отслеживать
изменения фазы и частоты принимаемого сигнала.
Один из возможных способов ослабления джиттера при передаче -
использование синхронных интерфейсов с отдельным тактовым сигналом (Word
Clock), а еще лучше - асинхронных двунаправленных с возможностью
согласования темпа передачи, наподобие RS-232. В этом случае стороны могут
не опасаться возможного опустения или переполнения буфера на приемном
конце, передача может выполняться блоками с более высокой скоростью, чем
идет вывод звука, а приемная сторона может использовать полностью
независимый стабильный генератор для извлечения отсчетов из буфера. Однако
все это имеет смысл только в том случае, когда приемник работает
непосредственно на ЦАП - при записи на носитель неравномерности такой
величины влияния на качество звука не оказывают.
Таким образом, в корректно реализованной системе все виды джиттера,
возникающие в чисто цифровых блоках и между ними, являются "внутренними" и
должны быть подавлены до передачи цифрового сигнала на ЦАП для оконечного
преобразования. Это может быть сделано при помощи промежуточного буфера,
схемы ФАПЧ с плавным изменением частоты генератора (медленное изменение в
небольших пределах, в отличие от дрожания, практически не ощущается на
слух), или каким-либо другим методом.
Для слуховой оценки звукового сигнала его необходимо воспроизвести либо
одновременно на двух разных системах, либо последовательно - на одной.
Даже если в обоих случаях сам цифровой сигнал будет одинаковым, набор
сопутствующих условий - аппарат, носитель, его микроструктура, первичные
сигналы при считывании информации, особенности работы декодеров, спектр
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28
|