МЕНЮ


Фестивали и конкурсы
Семинары
Издания
О МОДНТ
Приглашения
Поздравляем

НАУЧНЫЕ РАБОТЫ


  • Инновационный менеджмент
  • Инвестиции
  • ИГП
  • Земельное право
  • Журналистика
  • Жилищное право
  • Радиоэлектроника
  • Психология
  • Программирование и комп-ры
  • Предпринимательство
  • Право
  • Политология
  • Полиграфия
  • Педагогика
  • Оккультизм и уфология
  • Начертательная геометрия
  • Бухучет управленчучет
  • Биология
  • Бизнес-план
  • Безопасность жизнедеятельности
  • Банковское дело
  • АХД экпред финансы предприятий
  • Аудит
  • Ветеринария
  • Валютные отношения
  • Бухгалтерский учет и аудит
  • Ботаника и сельское хозяйство
  • Биржевое дело
  • Банковское дело
  • Астрономия
  • Архитектура
  • Арбитражный процесс
  • Безопасность жизнедеятельности
  • Административное право
  • Авиация и космонавтика
  • Кулинария
  • Наука и техника
  • Криминология
  • Криминалистика
  • Косметология
  • Коммуникации и связь
  • Кибернетика
  • Исторические личности
  • Информатика
  • Инвестиции
  • по Зоология
  • Журналистика
  • Карта сайта
  • Дискретизация и квантование изображений

    соответствующей энтропии. С помощью Р- разрядных чисел можно описать

    квантованяе по 2p уровням. Для этого следует проанализировать все N2

    отсчетов и подсчитать, сколько раз встречается каждый уровень квантования.

    Затем следует построить гистограмму яркости изображения, т.е. для каждого

    уровня квантования указать число его появлений в изображения. Разделив эти

    числа на общее число точек N2 , можно получить аппроксимацию плотности

    вероятности процесса, порождающего изображение. Если обозначить

    нормированные частоты через pi ( i = 1, 2, ... , 2p ), то энтропия по

    определению выражается суммой

    h = __[pic][pic] (4.19)

    и равна средней информации (измеряемой числом бит, приходящихся на элемент

    изображения), содержащейся в каждом элементе изображения. Анализ

    изображений показал, что типичное значение h гораздо меньше числа разрядов

    Р, необходимого для стандартного представления с помощью ИКМ. В работе [20]

    отмечалось, что энтропия имеет величину порядка 1 бит/точка. Это означает,

    что разрядность массива, описывающего изображение, можно (хотя бы

    теоретически) сократить без потерь информации в среднем до 1 бит/точка.

    Энтропия служит мерой статистической избыточности, но не дает сведений о

    ее происхождении. Источником избыточности, как подсказывает наблюдателю его

    зрение, является высокая степень однородности изображения на малых

    участках. Эту пространственную избыточность можно определить с помощью

    ковариационной матрицы изображения. Сначала лексикотрафически преобразуют

    матрицу из N[pic]N отсчетов изображения в N2 - компонентный вектор [т.е.

    элементы первой строки (или столбца) матрицы g( j, k ) становятся

    компонентами вектора с номерами от 1 до N, элементы второй строки (столбца)

    — компонентами с номерами от N+1 до 2 N и т.д.]. Затем вычисляют

    ковариационную матрицу изображения

    [ Cg ] = E { (g - E(g))(g - E(g))T } ,

    (4.20)

    где Е - среднее значение но ансамблю, a g - вектор, построенный из отсчетов

    изображения. На практике редко оказывается возможным проводить усреднение

    по ансамблю и ковариационную матрицу получают с помощью оценки

    пространственной корреляции [21].

    Ковариационные структуры, такие, как матрица [ Cg ], не имеют взаимно -

    однозначной связи с исходным изображением. Коул [21] показал, что многие

    неодинаковые изображения могут оказаться весьма сходными в ковариационном

    (или спектральном) смысле. Следовательно, имеются основания для замены

    сложной матричной структуры типа [Cg ] более простой. В частности,

    рассматривалось (см., например, работу [22] ) применение модели с

    авторегрессионным марковским процессом п-го порядка, где п обычно невелико

    (например, n = 3). Тот факт, что подобные модели оказываются корректными, и

    применение их оправдано при анализе методов сжатия информации, таких, как

    дифференциальная импульсно - кодовая модуляция (ДИКМ), указывает на

    высокую степень взаимосвязи между соседними участками изображения.

    При сжатии видеоинформации кроме статистических свойств изображения

    весьма важно учитывать и особенности получателя изображений. Зрение

    человека обладает ограниченными возможностями и характеризуется некоторыми

    известными (отчасти) отличительными особенностями. Использование,

    конкретных особенностей зрения для сокращения избыточности изображений

    называется психофизической обработкой. Известно, например, что при

    восприятии яркости света, попадающего в глаз, зрительная система ведет себя

    как нелинейная система с логарифмической характеристикой. Кроме того,

    система зрения человека не чувствительна к очень высоким или очень низким

    пространственным частотам, а в области средних частот ведет себя почти как

    полосовой фильтр, что обусловлено торможением нервных клеток сетчатки

    глаза. Нелинейность и частотная зависимость чувствительности зрительной

    системы позволили создать оптимальные системы сжатия видеоинформации. В

    этих системах для достижения большей устойчивости к ошибкам, появляющимся

    при кодировании и передаче, изображение обрабатывается примерно так же, как

    и в зрительной системе человека. Впервые это предложение было сделано

    Стокхэмом [23].

    Сокращение избыточности информации математически строго обосновывается

    положениями теории кодирования при заданном критерии точности [24]. Как

    отмечали Маннос и Сакрисон [17], эффективные теоремы теории кодирования при

    заданном критерии точности в задачах сжатия видеоинформации применить не

    удалось. Основной причиной этого явилась сложность выбора критерия

    допустимой величины ошибок, согласующегося со свойствами системы зрения

    человека. Манное и Сакрисон смогли показать, что можно пользоваться

    критерием, связанным с нелинейными и пространственно-частотными свойствами

    зрения. Их работа имеет очень важное значение для дальнейшего развития

    методов сокращения избыточности изображений. Введение подходящей

    предварительной обработки во всех схемах, которые будут рассмотрены ниже,

    может значительно улучшить качество работы систем сжатия видеоинформации.

    4.3.2. Схемы сокращения избыточности изображений с обработкой в

    пространственной области

    В одном из возможных вариантов схемы сокращения избыточности

    видеоинформации в первом блоке (схема рис. 4.7) выполняется операция

    тождественности, т.е. исходная картинка никак не изменяется, а все сжатие

    достигается за счет квантования и кодирования. Однако сжатие информации

    невозможно выполнять без использования критериев, учитывающих особенности

    наблюдателя и свойства передаваемых данных. Если, например, наблюдателю

    нужна точность 1/1000 , то необходимое число уровней квантования получается

    при использовании 10-разрядных двоичных чисел; если же допустима точность

    1/8 , то достаточно взять 3-разрядные числа. Следовательно, квантование при

    сжатии информации играет ограниченную роль. Однако сокращения избыточности

    можно добиться при кодировании, и одной из основных задач после создания

    Шенноном теории информации было построение кодов, оптимальных с точки

    зрения сокращения избыточности информации. Шеннон доказал, что существует

    код, для которого скорость передачи совпадает со скоростью создания

    информации источником. Таким образом, для изображений с энтропией порядка 1

    бит/точка существуют схемы кодирования, позволяющие построить коды со

    средней длиной в 1 бит/точка. К сожалению, само по себе существование таких

    кодов бесполезно, если отсутствуют алгоритмы их построения. Известны

    алгоритмы построения кодов, приближающихся к оптимальным. Например,

    кодирование по Хаффмену является эффективной процедурой для согласования

    кода со статистикой источника информации и позволяет сократить длину

    сигнала по сравнению со стандартной ИКМ. Однако подобные коды имеют

    переменное число сим1волов (т.е. при передаче сообщений кодовые слова

    состоят из различного числа символов); при кодировании и декодировании

    требуются сложные алгоритмы, связанные с записью, синхронизацией и

    вспомогательным накоплениям информации. Кроме того, вид подобных кодов

    очень сильно зависит от вероятности создания символов источником, и любые

    изменения вероятности могут привести к ухудшению характеристик кода (очень

    значительному в некоторых случаях). Следовательно, кодирование с

    квантованием может служить основным средством сжатия видеоинформации лишь в

    ограниченном числе случаев, так что необходимо искать другие методы.

    В качестве метода сжатия видеоинформации в плоскости пространственных

    координат, выполняемого )в первом блоке схемы рис. 4.7, наиболее широко

    применяется дифференциальная импульсно-кодовая модуляция (ДИКМ). По своей

    структуре схемы ДИКМ совпадают со схемами кодирования методом линейного

    предсказания (КЛП), применяемым при сжатии полосы речевых сигналов, и

    поэтому схемы ДИКМ изображений иногда называют схемами сжатия методом

    предсказания. Блок-схема ДИКМ приведена на рис. 4.8. В этом методе

    используется статистическая взаимосвязь яркостей отдельных точек

    изображения и для каждой точки формируется оценка яркости в виде линейной

    комбинации яркостей предшествующих точек. Под предшествующими точками

    подразумеваются точки, расположенные перед рассматриваемой точкой при

    развертке изображения сверху вниз и слева направо (как в телевидении),

    благодаря чему создается вполне определенный порядок следования точек

    изображения. Подобная схема, конечно, будет применима и тогда, когда

    изображение уже «развернуто» методом сканирования. Затем вычисляется и

    квантуется разность между фактическим значением яркости и ее оценкой.

    Квантованная разность подвергается кодированию и передается по каналу. На

    приемном конце символы декодируются, а информация восстанавливается с

    помощью схемы линейного предсказания n-го порядка (конечно, идентичной

    соответствующей схеме на передатчике), в которой формируются оценки

    яркости, добавляемые к разностям, полученным по каналу.

    Схемы предсказания, изображенные на рис. 4.8, называются схемами с

    предсказанием назад , поскольку квантование сигнала

    [pic]

    Рис. 4.8. Блок-схема системы сжатия методом ДИКМ с предсказывающим

    устройством n-го порядка.

    происходит внутри петли обратной связи, а при восстановлении сигнала

    предсказанное значение подается по схеме назад. Можно спроектировать схемы

    ДИКМ, в которых предсказанные значения сигнала подаются вперед, а также

    создать схемы ДИКМ, где блок квантования расположен вне петли обратной

    связи. Однако такие системы дают восстановленное изображение с большими

    ошибками. Схема с предсказанием назад необходима в приемнике потому, что

    символы поступают последовательно. При использовании в передатчике

    аналогичной схемы предсказания назад в случае отсутствия ошибок, связанных

    с квантованием, можно было бы восстановить изображение с абсолютной

    точностью. Если схему квантования включить в петлю предсказывающей схемы

    передатчика, то и в приемнике, и в передатчике предсказание будет

    осуществляться на основе одинаковых квантованных отсчетов, что позволит

    уменьшить ошибки восстановления.

    Сжатие в схемах ДИКМ достигается за счет вычитания сигналов, поскольку

    разности имеют значительно меньший динамический диапазон. Предположим,

    например, что исходное изображение передается методом ИКМ и для

    представления яркостей его точек нужны числа от 0 до 255. Тогда, если

    допустимая ошибка равна единице младшего разряда, то необходимо квантование

    в 8-разрядные числа. Однако значения разностей яркостей соседних точек

    будут гораздо меньшими; если разности (в том же масштабе) будут изменяться

    от 0 до 7, то для получения ошибки, равной единице младшего разряда,

    достаточно квантования в 3-разрядные числа.

    Поскольку идея ДИКМ достаточно проста, то, как следует из схем рис. 4.8,

    характеристики системы сокращения избыточности изображений методом ДИКМ

    определяются [порядком предсказывающего устройства п, значениями

    коэффициентов прогнозирования аi, числом уровней квантования и их

    расположением.

    Порядок предсказывающего устройства зависит от статистических

    характеристик изображения. Как правило, если последовательность отсчетов

    может быть промоделирована авторегрессионным марковским процессом п-го

    порядка, то разности, полученные с помощью оптимального предсказывающего

    устройства п-го порядка, будут образовывать последовательность

    некоррелированных чисел [20]. Изображения, очевидно, не являются

    марковскими процессами п-го порядка, но опыт работы по сжатию изображений

    показывает, что корреляционные свойства изображений можно описать

    марковским процессом третьего порядка, а это приводит к предсказывающим

    устройствам третьего порядка (п=3) [22]. Аналогично при моделировании

    изображений было выяснено, что ДИКМ с предсказывающими устройствами более

    высоких порядков не дает большего выигрыша в качестве изображения (как по

    субъективным, так и по объективным данным).

    Коэффициенты предсказания аi можно определить с помощыо анализа средних

    квадратических ошибок. Пусть g(k) - отсчеты на строке развертки, a

    [pic][pic](k) - предсказанные значения этих отсчетов. Необходимо, чтобы

    средняя квадратическая ошибка была минимальна, т.е. нужно найти

    min e = E { g(k) - [pic] }

    (4.21)

    по всем k, аi

    Это известная задача, и если процесс g(k) стационарен, то ее решение имеет

    вид [25]

    [pic] , (4.22)

    где

    r ( j - i ) = E [ g ( k - j ) g (k -i ) ]

    (4.23)

    обычно называется автокорреляционной функцией процесса g. Коэффициенты ai

    получаются решением системы уравнений (4.22).

    Оптимальные значения коэффициентов предсказания зависят от взаимосвязей

    точек изображения, описываемых автокорреляционной функцией. Из определения

    (4.20) видно, что в случае стационарных данных автокорреляционная функция

    отличается от вышерассмотренной функции на постоянную величину. При

    нестационарных данных функция r (в уравнении (4.23) зависит от

    пространственных переменных и оптимальные коэффициенты предсказания должны

    изменяться в зависимости от пространственных координат. Это характерно для

    изображений. К счастью, нестационарные статистические характеристики

    изображений обычно можно достаточно хорошо аппроксимировать стационарными

    функциями, так что неперестраивающееся линейное устройство предсказания

    дает вполне хорошие результаты. При сжатии видеоинформации методом ДИКМ

    ошибки обычно появляются на границах изображаемых предметов, где

    предположение о стационарности удовлетворяется в наименьшей степени, и на

    восстановленном изображении воспринимаются визуально как аномально -

    светлые или темные точки.

    Выбор числа уровней квантования и расположения порогов квантования

    является задачей отчасти количественной и отчасти качественной.

    Расположение порогов квантования можно найти количественными расчетами. В

    работе Макса [26] впервые было рассмотрено неравномерное квантование,

    зависящее от функции распределения квантуемого сигнала и сводящее к

    минимуму среднее квадратическое значение ошибки, вызванной ограниченностью

    числа уровней квантования. Алгоритм Макса позволяет найти оптимальное

    расположение точек перехода для заданного числа уровней квантования. Однако

    число уровней квантования выбирается исходя из субъективных качественных

    соображений.

    Минимальное число уровней квантования paвно двум (одноразрядные числа) и

    соответствует такому квантованию изображений, при котором разность яркостей

    принимает фиксированное (положительное или отрицательное) значение. Этот

    способ обычно называют дельта - модуляцией, схему ДИКМ (рис. 4.8) можно

    упростить заменой квантователя на ограничитель, а предсказывающего

    устройства n-го порядка на интегратор. При сокращении избыточности

    изображений методом дельта-модуляции наблюдаются те же недостатки, что и

    при дельта-модуляции других сигналов, например речевых [27], а именно

    затягивание фронтов и искажения дробления. Однако если частота

    дискретизации изображения выбрана намного больше частоты Найквиста, то

    сжатие методом дельта - модуляции приводит к малым (субъективно замечаемым)

    ошибкам. Если частота дискретизации приближается к частоте Найквиста, то на

    изображении в большей степени будут проявляться затягивания фронтов (на

    контурах изображений) и искажения дробления (на участках с постоянной

    яркостью). Как и при сжатии речи [27], адаптивная дельта-модуляция

    позволяет уменьшить эти ошибки. Однако в целом при передаче изображений

    дельта - модуляция оказалась менее эффективной, что при передаче речи.

    Квантование с числом уровней, большим двух, позволяет при сокращении

    избыточности получить изображения более высокого качества. Система сжатия

    методом ДИКМ с 8-уровневым (З-разрядным) квантованием

    при оптимальном размещении порогов дает изображения, качество которых такое

    же, как в системе с ИКМ, имеющей разрядность от 6 до 8. Исключение

    составляют ошибки вблизи линий резкого изменения яркости.

    Сигнал с выхода устройства квантования, конечно, следует кодировать,

    поскольку распределение вероятностей «квантованных разностей не является

    равномерным. При удачном выборе кода (например, кода Шеннона — Фано или

    Хаффмена) удается дополнительно понизить общую скорость создания

    информации. Прэтт [28] указывает, что при использовании кода Хаффмена в

    пределе удается понизить скорость создания информации до 2,5 бит/точка. Это

    дополнительное понижение скорости требуется сопоставить с увеличением

    стоимости и сложности запоминающего устройства, синхронизаторов и

    вспомогательных регистров памяти, необходимых для работы с кодами Хаффмена.

    Выше обсуждались вопросы сжатия изображений с помощью ДИКМ при выборе

    элементов по строке (т.е. для прогноза брались точки, лежащие на текущей

    строке развертки). В силу двумерного характера изображений возможно (и

    целесообразно) расширить метод ДИКМ так, чтобы при прогнозе учитывались

    яркости в точках, лежащих не только на текущей, но и на предшествующих

    строках развертки. Схемы сжатия методом ДИКМ с таким двумерным

    Страницы: 1, 2, 3


    Приглашения

    09.12.2013 - 16.12.2013

    Международный конкурс хореографического искусства в рамках Международного фестиваля искусств «РОЖДЕСТВЕНСКАЯ АНДОРРА»

    09.12.2013 - 16.12.2013

    Международный конкурс хорового искусства в АНДОРРЕ «РОЖДЕСТВЕНСКАЯ АНДОРРА»




    Copyright © 2012 г.
    При использовании материалов - ссылка на сайт обязательна.