НАУЧНЫЕ РАБОТЫ

Реферат: Дискретизация и квантование изображений

Хотя разложение изображения на блоки и делает сжатие видеоинформации методом КЛ - преобразования реально осуществимым процессом, но эффективность его остается недостаточной. Большой объем вычислений препятствует использованию подобных методов для обработки изображений типа телевизионных.

Создание алгоритмов быстрых преобразований (Фурье, Адамара и т.д.) существенно повлияло на многие области применения цифровой обработки сигналов. Аналогичным образом оно - сказалось и на методах сокращения избыточности изображений. Любое линейное преобразование, подобное разложению Карунена - Лоэва, переводит изображение в новую систему координат. В силу свойств КЛ - преобразования случайные компоненты изображения в новых координатах оказываются некоррелированными. Резонно спросить: будут ли другие преобразования, особенно быстрые типа БПФ, обладать такими же полезными свойствами? К счастью, ответ оказывается положительным. Хотя быстрые преобразования и не приводят к полной некоррелированности компонент, как в случае КЛ - преобразования, но все же они дают очень хорошие результаты. Их достоинства, связанные с быстротой вычислений, полностью компенсируют некоторое понижение эффективности сжатия, характерное для них.

Схемы сжатия на основе быстрых преобразований можно описать примерно так же, как и схемы с КЛ - преобразованием. Дополнительным достоинством быстрых алгоритмов является их разделимость, так что двумерные преобразования можно выполнить с 'помощью одномерных операций. Кроме того, их проще описать математически. Если матрица [W] соответствует оператору ортогонального унитарного одномерного преобразования (как, например, матрицы ядер преобразований Фурье, Адамара и т.д. [31] ), то «поворот» изображения в новую систему координат выполняется по формуле

[ G ] = [ W ]T [ g ] [ W ] , (4.30)

гдe ,[g] - исходная матрица отсчетов изображения размером NN, a [G] - преобразование матрицы [g]. Нетрудно заметить, что формула (4.30) описывает двухэтапное преобразование: сначала по строкам изображения, а затем по столбцам преобразований от строк. Записывая преобразование (4.30) в явном виде через элементы матриц, получим:

G(m,n) =

(4.31)

где второе равенство является следствием разделимости ядра преобразования. Свойством разделимости обладает ядро преобразования Фурье, наиболее часто применяемого на практике:

(m,n,j,k) = exp [- ] =

(4.32)

= exp [ - ] exp [ - ] ,

а также ядра менее известных преобразований, таких, как преобразования Адамара и Хаара. Более подробно этот вопрос рассмотрен в работе Эндрюса [31].

Собственные значения i , получаемые методом КЛ - преобразования, соответствуют фактическим величинам дисперсий проекций вектора-изображения на координатные оси пространства, в котором вñå компоненты изображения некоррелированы. В системах координат, получаемых при быстром преобразовании, коэффициенты преобразования (т.е. элементы матрицы [G] ) равны проекциям вектора - изображения на оси координат, полученным с помощью матрицы преобразования [W], но не являются дисперсиями. Однако как при КЛ - преобразовании, так и в пространствах быстрых преобразований происходит концентрация энергии. В первом случае наибольшие

дисперсии (и, следовательно, наибольшие энергии) связаны с теми столбцами матрицы [Ф] или [Фр], которые соответствуют предпочтительным (или «естественным») направлениям наибольшего изменения видеоинформации. Аналогично в пространстве быстрого преобразования наибольшими являются коэффициенты, которые соответствуют предпочтительным (или «естественным») направлениям вектора-изображения. С этой точки зрения сжатие в пространстве преобразований (как для преобразования Карунена - Лоэва, так и для быстрых преобразований) является по существу разложением изображения в ряд по базисным векторам (или базисным изображениям, так как каждый вектор должен описывать двумерную структуру) и таким усечением разложения, при котором ошибка мала, а число отбрасываемых составляющих - большое. Усечение оказывается возможным потому, что небольшое число компонент содержит основную часть энергии изображения.

Для иллюстрации рассмотрим схему сжатия в пространстве-преобразовании, основанную на преобразовании Фурье. Из соотношений (4.31) и (4.32) видно, что (т, п)-й коэффициент преобразования G(m,n) является проекцией исходного изображения g(j,k) на базисный вектор (или базисное изображение), образованный при помощи (т, п)-го значения ядра Фурье

( m , n) = exp ( ) . (4.33)

Для типичных изображений характерно, что в области пространственных частот элементы с малыми индексами велики по сравнению с элементами с большими индексами. Таким образом, структура изображения обычно имеет низкочастотный характер. Низкочастотные составляющие определяют контуры предметов, а также яркость и контрастность изображения. Высокочастотные - составляющие создают резкие линии и определяют общую четкость изображения, но суммарная энергия их невелика. Так, 95% энергии типичного изображения может приходиться на низкочастотные составляющие, занимающие 5% от общей площади двумерной пространственно - частотной области преобразования Фурье. Сохраняя эти спектральные составляющие и достаточно много высокочастотных компонент, чтобы резкость изображения была приемлема для человеческого глаза, можно добиться существенного уменьшения объема избыточной информации.

После того как установлено, что основной принцип сжатия в пространстве преобразований заключается в избирательном сохранении коэффициентов разложения, задача создания системы сжатия изображений может показаться нетрудной. Сложность построения подобных схем кодирования обусловлена необходимостью сравнения свойств операторов различных преобразований и создания методов выбора коэффициентов преобразования, которые следует оставить. Кроме того, задача усложняется квантованием выбранных коэффициентов и кодированием квантованных чисел. Ниже приведены краткие результаты исследований, посвященных этим вопросам.

Был исследован ряд алгоритмов быстрого преобразования, таких, как преобразования Фурье, Адамара, Xaapa [32], слэнт - преобразование [33], косинусное преобразование [34], преобразование по дискретно - линейному базису [35]. Все алгоритмы сравнивались по эффективности сжатия с преобразованием Карунена - Лоэва (оптимальным). Для выявления оптимального алгоритма необходимо сравнивать все преобразования в одинаковых условиях - при одном и том же входном изображении и одинаковых параметрах схем выбора, квантования и кодирования коэффициентов. Этого не было сделано, но приводимые в литературе данные позволяют сделать следующие выводы.

1. Ни один из алгоритмов быстрого преобразования не обеспечивает оптимальной эффективности сжатия изображения, какая получается (при использовании преобразования Карунена - Лоэва.

2. По таким критериям качества, как средняя квадратическая ошибка, ближайшим к преобразованию Карунена - Лоэва, оказывается слэнт - преобразование, а за ним следуют по порядку преобразования Фурье, Адамара и Хаара, причем сравнение выполнялось для изображений небольшого формата, например 1616 или 3232 отсчета.

3. Разница между наилучшими показателями слэнт - преобразования и наихудшими показателями преобразования Xaapa (как по субъективным, так и по объективным критериям) невелика.

Коэффициенты преобразования, которые необходимо сохранить и передать, можно выбрать двумя способами. При пороговой дискретизации устанавливается некоторый уровень (определяемый, как правило, на основе полной средней квадратической ошибки), и коэффициенты, его превышающие, сохраняются для передачи, я все остальные отбрасываются. При зонной дискретизации в пространстве преобразований размещается маска (трафарет) и элементы, попавшие в нее, сохраняются, а остальные отбрасываются. Операции, выполняемые в ходе преобразования, обычно упорядочиваются в соответствии с некоторым обобщенным индексом (частотой или порядком базисной функции), и коэффициенты преобразования выстраиваются в ряд в порядке увеличения сложности (т.е. числа колебаний на единицу длины) базисных векторов, причем энергия изображения концентрируется в области низких частот или малых порядков. Следовательно, зонная дискретизация эквивалентна обобщенной низкочастотной фильтрации изображения. Пороговая дискретизация, напротив, позволяет выделить значительные коэффициенты преобразования, расположенные где-либо в пространстве преобразований. В результате оказалось, что пороговая дискретизация при одинаковом числе отброшенных коэффициентов дает более высокое качество восстановленного изображения, чем зонная дискретизация. К сожалению, в схемах с пороговой дискретизацией вместе с каждым отсчетом необходимо передавать и его местоположение в пространстве преобразований. По этой причине объем передаваемой информации может заметно возрасти, если положения отсчетов передаются простыми кодами. Однако коды с переменной длиной дают возможность передать адрес при небольшом увеличении числа разрядов кода [32].

Отсчеты, выбранные из пространства преобразований, необходимо квантовать. К сожалению, обычно они имеют гораздо больший динамический диапазон, чем исходные отсчеты в пространстве преобразований, что подтверждает, например, опыт работы с преобразованием Фурье. Такое явление наводит на мысль об использовании чисел с переменной разрядностью, зависящей от значения коэффициента, но это значительно усложняет процесс обработки. Кроме того, для создания устройства квантования, дающего минимальный шум квантования, необходимо знать плотность вероятности значений отсчетов. Исследования плотности вероятности отсчетов в пространстве преобразований [32, 33] показали, что наилучший компромисс между простотой и точностью обеспечивает квантование, основанное на гауссовской плотности, при фиксированной разрядности отсчетов. В этом случае удается получить высококачественные восстановленные изображения, если число уровней квантования составляет всего 64 (6 разрядов) [32]. По-видимому, это связано с тем, что операторы преобразований линейны и дают взвешенные суммы, а сумма произвольных случайных величин распределена по закону, близкому к гауссовскому.

Способ кодирования коэффициентов разложении зависит от примененного алгоритма выборка коэффициентов. Как уже отмечалось, при пороговой дискретизации необходимо, чтобы код содержал адрес отсчета в пространстве преобразования, причем на каждый отсчет отводится фиксированное число разрядов кодовой комбинации. При зонной дискретизации используется низкочастотный характер изображения, т.е. тот факт, что коэффициенты разложения, соответствующие низким частотам (или малым порядкам базисных векторов), имеют большую величину, чем высокочастотные коэффициенты. Этим можно воспользоваться, уменьшая число разрядов кода, отводимых на отсчет, по мере перехода от низких частот к высоким [33]. Информацию о положении отсчетов передавать не нужно, поскольку форма зоны известна, а порядок выбора и передачи отсчетов .внутри зоны может быть зафиксирован.

В целом сокращение избыточности путем обработки в пространстве преобразований (т.е. преобразование, выбор коэффициентов, их квантование и кодирование) позволяет получить хорошие результаты. На рис. 4.10 сравниваются несколько разных преобразований. Изображения на рис. 4.9 и 4.10 состоят из 256256 точек, представленных 8-разрядными числами. Нетрудно видеть, что сжатие путем обработки в пространстве преобразований дает лучшие результаты, чем сжатие методом ДИКМ.

4.3.4. Другие аспекты задачи сокращения избыточности

видеоинформации

Поскольку часто изображения состоят из многих последовательно появляющихся кадров (как, например, в телевидении) и изображение от кадра к кадру меняется мало, то в будущем, по видимому, больше внимания будет уделяться межкадровому сжатию (в отличие от внутрикадрового). Как отмечалось ранее, схемы межкадрового сжатия методом ДИКМ уже изучались. Оказалось, что комбинация внутрикадрового и межкадрового кодирования (в тех случаях, где это возможно сделать) может привести к уменьшению объема передаваемой информации в 30—50 раз.

Интерес к цветным изображениям возрастает; уже проводились опыты по сокращению их избыточности методом ДИКМ и методом преобразования [33, 36]. Методы сжатия аналогичны рассмотренным выше, но их реализация усложняется из-за наличия трех цветовых сигналов.

В последнее время созданы гибридные системы сжатия. В них для сжатия по одной координате (обычно по строкам дискретизованного изображения, или по горизонтали) используется схема с преобразованием, а по другой координате (по столбцам, или по вертикали) - схема с ДИКМ. В результате получается более простая система ( b ней не требуются двумерные преобразования), но дающая такую же или лучшую эффективность кодирования, чем системы с ДИКМ или с преобразованием [20].

Отметим, наконец, что все рассмотренные выше схемы не являются адаптивными, т.е. в них не изменяются в зависимости от свойств изображения распределение кодовых разрядов, расположение уровней квантования и т.д. Тешер [37] показал, что за счет адаптивности можно дополнительно повысить эффективность кодирования изображений. При одинаковом качестве восстановленного непрерывного изображения ему удалось сократить объем передаваемой информации почти вдвое по сравнению с другими системами.

4.4. Повышение резкости изображений

Задача любой системы, формирующей изображение, состоит в создании резкого, чистого изображения, свободного от искажений. Это не всегда возможно сделать. Во-первых, каждая реальная система формирования изображений обладает определенными ограниченными возможностями; импульсный отклик реальной системы имеет конечную ширину, что приводит к неизбежному снижению разрешающей способности. Если на изображении необходимо выделять важные детали, размер которых близок к ширине импульсного отклика, то необходимо бороться с потерями разрешения. Так, например, с межпланетных космических аппаратов приходят снимки замечательного качества (особенно, если учесть, откуда они получены), но ученые, изучающие планеты, всегда пытаются увидеть на них элементы поверхности планеты, искаженные в силу ограниченного разрешения фотокамер. Во-вторых, изображения могут быть испорчены из-за неудачного стечения обстоятельств. Можно принять все меры предосторожности, чтобы получить высококачественные снимки, но какая-то часть их окажется испорченной либо за счет движения объекта или камеры, либо из-за плохой фокусировки и т.д. Среди плохих снимков всегда находятся столь важные или настолько редкие, что стоит пытаться их исправить. Устранение искажений относится к задачам повышения резкости (или восстановления ) изображений.

Ниже читатель увидит, что для решения задачи восстановления (или повышения резкости) изображения предложено несколько различных .методов. Для решения же рассмотренной в предыдущем разделе задачи сокращения избыточности изображений было представлено только два существенно различных метода. Как будет показано, восстановление изображений является задачей, не имеющей единственного решения, что и привело к многочисленным попыткам найти лучший способ решения.

4.4.1. Важные аспекты задачи повышения резкости

изображений

Как показано выше, основное уравнение формирования изображения имеет вид

g(x, у)= , (4.34)

где g - сформированное изображение, h - импульсный отклик или аппаратная функция, а f - функция распределения яркости объ-

Рис. 4.11.

а - зависимость оптической плотности от экспозиции; б - зависимость оптической плотности от логарифма экспозиции.

екта. Конечно, непосредственно изображение g наблюдатель не получает; изображение существует в виде модуляции интенсивности какого-то излучения, исходящего от объекта. Изображение становится известным только после того, как оно будет воспринято и записано некоторым образом (например, на фотопленке, сетчатке глаза, люминесцентном экране). В процессе восприятия и записи в изображение вносятся шумы, поскольку при любом способе записи сигналов присутствуют шумы записывающей системы. Весь процесс получения изображения, т.е. формирование изображения, его восприятие и запись, был показан в виде блок-схемы на рис. 4.3. Таким образом, восстанавливать изображение приходится по записи, содержащей шум.

Задача повышения резкости изображения усложняется особенностями записывающей системы и ее собственным шумом. Как отмечалось в разд. 4.2, наиболее распространенная система для записи изображений, фотопленка, имеет нелинейную характеристику и вносит шум, модулированный сигналом. Типичная характеристика фотопленки приведена на рис. 4.11,а, где показана зависимость оптической плотности, определенной выше, от интенсивности падающего излучения, причем предполагается, что за .время выдержки интенсивность не изменяется. Обычно такую информацию приводят па графиках с логарифмическим масштабом по оси абсцисс (рис. 4.11,б); получающийся в таких координатах график зависимости D от log Е имеет линейный участок. Вид этой кривой иногда порождает заблуждения относительно резкой нелинейности характеристики фотопленки. Поскольку изображение записывается на пленке зернами серебра, а плотность серебряного слоя пропорциональна оптической плотности, то очевидно, что процессы записи на фотопленку нелинейны по своей сути.

Столь же сложны процессы, создающие шумы пленки. Дисперсия шума, вызванного случайным размещением зерен серебра на пленке, пропорциональна локальной .плотности проявленных серебряных зерен, причем функция пропорциональности усложняется наличием степенного множителя [8]. Таким образом, шум представляет собой флуктуации оптической плотности записи изображения, зависящие от сигнала. В общем случае задача цифровой обработки сигналов с шумом, зависящим от сигнала, еще не решена. Немногочисленные известные результаты [10] указывают, что зависимость шума от сигнала может оказаться не слишком большой проблемой. Поэтому обычно предполагают, что шум создается независимыми от сигнала флуктуациями плотности. Однако логарифмическая зависимость между оптической плотностью пленки, запечатлевшей изображение, и интенсивностью падающего на пленку излучения усложняет задачу. Даже если предположить, что флуктуации оптической плотности не зависят от сигнала, в свете, прошедшем через пленку, будет присутствовать мультипликативный шум, зависящий от сигнала. Аналогичные эффекты наблюдаются в фотоэлектронных системах (типа телевизионных и им подобных), характеристики которых описываются степенным законом.

Страницы: 1, 2, 3, 4, 5, 6, 7, 8

Приглашения

09.12.2013 - 16.12.2013

Международный конкурс хореографического искусства в рамках Международного фестиваля искусств «РОЖДЕСТВЕНСКАЯ АНДОРРА»

09.12.2013 - 16.12.2013

МЕНЮ

НАУЧНЫЕ РАБОТЫ

Реферат: Дискретизация и квантование изображений

Приглашения

Международный конкурс хореографического искусства в рамках Международного фестиваля искусств «РОЖДЕСТВЕНСКАЯ АНДОРРА»

Международный конкурс хорового искусства в АНДОРРЕ «РОЖДЕСТВЕНСКАЯ АНДОРРА»