МЕНЮ


Фестивали и конкурсы
Семинары
Издания
О МОДНТ
Приглашения
Поздравляем

НАУЧНЫЕ РАБОТЫ


  • Инновационный менеджмент
  • Инвестиции
  • ИГП
  • Земельное право
  • Журналистика
  • Жилищное право
  • Радиоэлектроника
  • Психология
  • Программирование и комп-ры
  • Предпринимательство
  • Право
  • Политология
  • Полиграфия
  • Педагогика
  • Оккультизм и уфология
  • Начертательная геометрия
  • Бухучет управленчучет
  • Биология
  • Бизнес-план
  • Безопасность жизнедеятельности
  • Банковское дело
  • АХД экпред финансы предприятий
  • Аудит
  • Ветеринария
  • Валютные отношения
  • Бухгалтерский учет и аудит
  • Ботаника и сельское хозяйство
  • Биржевое дело
  • Банковское дело
  • Астрономия
  • Архитектура
  • Арбитражный процесс
  • Безопасность жизнедеятельности
  • Административное право
  • Авиация и космонавтика
  • Кулинария
  • Наука и техника
  • Криминология
  • Криминалистика
  • Косметология
  • Коммуникации и связь
  • Кибернетика
  • Исторические личности
  • Информатика
  • Инвестиции
  • по Зоология
  • Журналистика
  • Карта сайта
  • Современные методы позиционирования и сжатия звука

    представляют все различные типы слушателей, и предоставить пользователю

    простой способ выбрать именно тот набор HRTF функций, который наилучшим

    образом соответствует ему (имеются в виду рост, форма головы, расположение

    ушей и т.д.). Несмотря на то, что такой метод предложен, пока никаких

    стандартных наборов HRTF функций не существует.

    Использование индивидуализированных HRTF функций. В этом случае необходимо

    производить определение HRTF исходя из параметров конкретного слушателя,

    что само по себе сложная и требующая массы времени процедура. Тем не менее,

    эта процедура обеспечивает наилучшие результаты.

    Использование метода моделирования параметров определяющих HRTF, которые

    могут быть адаптированы к каждому конкретному слушателю. Именно этот метод

    сейчас применяется повсеместно в технологиях 3D звука.

    На практике существуют некоторые проблемы, связанные с созданием базы

    HRTF функций при помощи манекена. Результат будет соответствовать

    ожиданиям, если манекен и слушатель имеют головы одинакового размера и

    формы, а также ушные раковины одинакового размера и формы. Только при этих

    условиях можно корректно воссоздать эффект звучания в вертикальной

    плоскости и гарантировать правильное определение местоположения источников

    звука в пространстве. Записи, сделанные с использованием HRTF называются

    binaural recordings, и они обеспечивают высококачественный 3D звук. Слушать

    такие записи надо в наушниках, причем желательно в специальных наушниках.

    Компакт диски с такими записями стоят существенно дороже стандартных

    музыкальных CD. Чтобы корректно воспроизводить такие записи через колонки

    необходимо дополнительно использовать технику CC. Но главный недостаток

    подобного метода - это отсутствие интерактивности. Без дополнительных

    механизмов, отслеживающих положение головы пользователя, обеспечить

    интерактивность при использовании HRTF нельзя. Бытует даже поговорка, что

    использовать HRTF для интерактивного 3D звука, это все равно, что

    использовать ложку вместо отвертки: инструмент не соответствует задаче.

    Sweet Spot

    На самом деле значения HRTF можно получить не только с помощью

    установленных в ушах манекена специальных внутриканальных микрофонов (inter-

    canal microphones). Используется еще и так называемая искусственная ушная

    раковина. В этом случае прослушивать записи нужно в специальных

    внутриканальных (inter-canal) наушниках, которые представляют собой

    маленькие шишечки, размещаемые в ушном канале, так как искусственная ушная

    раковина уже перевела всю информацию о позиционировании в волновую форму.

    Однако нам гораздо удобнее слушать звук в наушниках или через колонки. При

    этом стоит помнить о том, что при записи через inter-canal микрофоны вокруг

    них, над ними и под ними происходит искажение звука. Аналогично, при

    прослушивании звук искажается вокруг головы слушателя. Поэтому и появилось

    понятие sweet spot, т.е. области, при расположении внутри которой слушатель

    будет слышать все эффекты, которые он должен слышать. Соответственно, если

    голова слушателя расположена в таком же положении, как и голова манекена

    при записи (и на той же высоте), тогда будет получен лучший результат при

    прослушивании. Во всех остальных случаях будут возникать искажения звука,

    как между ушами, так и между колонками. Понятно, что необходимость выбора

    правильного положения при прослушивании, т.е. расположение слушателя в

    sweet spot, накладывает дополнительные ограничения и создает новые

    проблемы. Понятно, что чем больше область sweet spot, тем большую свободу

    действий имеет слушатель. Поэтому разработчики постоянно ищут способы

    увеличить область действия sweet spot.

    Частотная характеристика

    Действие HRTF зависит от частоты звука; только звуки со значениями

    частотных компонентов в пределах от 3 kHz до 10 kHz могут успешно

    интерпретироваться с помощью функций HRTF. Определение местоположения

    источников звуков с частотой ниже 1 kHz основывается на определении времени

    задержки прибытия разных по фазе сигналов до ушей, что дает возможность

    определить только общее расположение слева/справа источников звука и не

    помогает пространственному восприятию звучания. Восприятие звука с частотой

    выше 10 kHz почти полностью зависит от ушной раковины, поэтому далеко не

    каждый слушатель может различать звуки с такой частотой. Определить

    местоположение источников звука с частотой от 1 kHz до 3 kHz очень сложно.

    Число ошибок при определении местоположения источников звука возрастает при

    снижении разницы между соотношениями амплитуд (чем выше пиковое значение

    амплитуды звукового сигнала, тем труднее определить местоположение

    источника). Это означает, что нужно использовать частоту дискретизации

    (которая должна быть вдвое больше значения частоты звука) соответствующей

    как минимум 22050 Hz при 16 бит для реальной действенности HRTF.

    Дискретизация 8 бит не обеспечивает достаточной разницы амплитуд (всего 256

    вместо 65536), а частота 11025 Hz не обеспечивает достаточной частотной

    характеристики (так как при этом максимальная частота звука соответствует

    5512 Hz). Итак, чтобы применение HRTF было эффективным, необходимо

    использовать частоту 22050 Hz при 16 битной дискретизации.

    Ушная раковина (Pinna)

    Мозг человека анализирует разницу амплитуд, как звука, достигшего

    внешнего уха, так и разницу амплитуд в слуховом канале после ушной раковины

    для определения местоположения источника звука. Ушная раковина создает

    нулевую и пиковую модель звучания между ушами; эта модель совершенно разная

    в каждом слуховом канале и эта разница между сигналами в ушах представляет

    собой очень эффективную функциюдля определения, как частоты, так и

    местоположения источника звука. Но это же явление является причиной того,

    что с помощью HRTF нельзя создать корректного восприятия звука через

    колонки, так как по теории ни один из звуков, предназначенный для одного

    уха не должен быть слышимым вторым ухом.

    Мы вновь вернулись к необходимости использования дополнительных

    алгоритмов CC. Однако, даже при использовании кодирования звука с помощью

    HRTF источники звука являются неподвижными (хотя при этом амплитуда звука

    может увеличиваться). Это происходит из-за того, что ушная раковина плохо

    воспринимает тыловой звук, т.е. когда источники звука находятся за спиной

    слушателя. Определение местоположения источника звука представляет собой

    процесс наложения звуковых сигналов с частотой, отфильтрованной головой

    слушателя и ушными раковинами на мозг с использованием соответствующих

    координат в пространстве. Так как происходит наложение координат только

    известных характеристик, т.е. слышимых сигналов, ассоциируемых с визуальным

    восприятием местоположения источников звука, то с течением времени мозг

    "записывает" координаты источников звука и в дальнейшем определение их

    местоположения может происходить лишь на основе слышимых сигналов. Но видим

    мы только впереди. Соответственно, мозг не может правильно расположить

    координаты источников звука, расположенных за спиной слушателя при

    восприятии слышимых сигналов ушной раковиной, так как эта характеристика

    является неизвестной. В результате, мозг может располагать координаты

    источников звука совсем не там, где они должны быть. Подобную проблему

    можно решить только при использовании вспомогательных сигналов, которые бы

    помогли мозгу правильно располагать в пространстве координаты источников

    звуков, находящихся за спиной слушателя.

    Неподвижные источники звука

    Все выше сказанное подвело нас к еще одной проблеме:

    Если источники звука неподвижны, они не могут быть точно локализованы,

    как "статические" при моделировании, т.к. мозгу для определения

    местоположения источника звука необходимо наличие перемещения (либо самого

    источника звука, либо подсознательных микро перемещений головы слушателя),

    которое помогает определить расположение источника звука в геометрическом

    пространстве. Нет никаких оснований, ожидать, что какая-либо система на

    базе HRTF функций будет корректно воспроизводить звучание, если один из

    основных сигналов, используемый для определения местоположения источника

    звука, отсутствует. Врожденной реакцией человека на неожидаемый звук

    является повернуть голову в его сторону (за счет движения головы мозг

    получает дополнительную информацию для локализации в пространстве источника

    звука). Если сигнал от источника звука не содержит особую частоту, влияющую

    на разницу между фронтальными и тыловыми HRTF функциями, то такого сигнала

    для мозга просто не существует; вместо него мозг использует данные из

    памяти и сопоставляет информацию о местоположении известных источников

    звука в полусферической области.

    Каково же будет решение?

    Лучший метод воссоздания настоящего 3D звука это использование

    минимальной частоты дискретизации 22050 Hz при 16 битах и использования

    дополнительных тыловых колонок при прослушивании. Такая платформа обеспечит

    пользователю реалистичное воспроизведение звука за счет воспроизведение

    через достаточное количество колонок (минимум три) для создания настоящего

    surround звучания. Преимущество такой конфигурации заключается в том, что

    когда слушатель поворачивает голову для фокусировки на звуке какого-либо

    объекта, пространственное расположение источников звука остается неизменным

    по отношению к окружающей среде, т.е. отсутствует проблема sweet spot.

    Есть и другой метод, более новый и судить о его эффективности пока

    сложно. Суть метода, который разработан Sensaura и называется MultiDrive,

    заключается в использовании HRTF функций на передней и на тыловой паре

    колонок (и даже больше) с применением алгоритмов CC. На самом деле Sensaura

    называет свои алгоритмы СС несколько иначе, а именно Transaural Cross-talk

    cancellation (TCC), заявляя, что они обеспечивают лучшие низкочастотные

    характеристики звука. Инженеры Sensaura взялись за решение проблемы

    восприятия звучания от источников звука, которые перемещаются по бокам от

    слушателя и по оси фронт/тыл. Заметим, что Sensaura для вычисления HRTF

    функций использует так называемое "цифровое ухо" (Digital Ear) и в их

    библиотеке уже хранится более 1100 функций. Использование специального

    цифрового уха должно обеспечивать более точное кодирование звука.

    Подчеркнем, что Sensaura создает технологии, а использует интерфейс DS3D от

    Microsoft.

    Технология MultiDrive воспроизводит звук с использованием HRTF функций

    через четыре или более колонок. Каждая пара колонок создает фронтальную и

    тыловую полусферу соответственно.

    Фронтальные и тыловые звуковые поля специальным образом смещены с целью

    взаимного дополнения друг друга и за счет применения специальных алгоритмов

    улучшает ощущения фронтального/тылового расположения источников звука. В

    каждом звуковом поле применяются собственный алгоритм cross-talk

    cancellation (CC). Исходя из этого, есть все основания предполагать, что

    вокруг слушателя будет плавное воспроизведение звука от динамично

    перемещающихся источников и эффективное расположение тыловых виртуальных

    источников звука. Так как воспроизводимые звуковые поля основаны на

    применении HRTF функций, каждое из создаваемых sweet spot (мест, с

    наилучшим восприятием звучания) способствует хорошему восприятию звучания

    от источников по сторонам от слушателя, а также от движущихся источников по

    оси фронт/тыл. Благодаря большому углу перекрытия результирующее место с

    наилучшим восприятием звука (sweet spot) покрывает область с гораздо

    большей площадью, чем конкурирующие четырех колоночные системы

    воспроизведения. В результате качество воспроизводимого 3D звука должно

    существенно повысится.

    Если бы не применялись алгоритмы cross-talk cancellation (CC) никакого

    позиционирования источников звука не происходило бы. Вследствие

    использования HRTF функций на четырех колонках для технологии MultiDrive

    необходимо использовать алгоритмы CC для четырех колонок, требующие

    чудовищных вычислительных ресурсов. Из-за того, что обеспечить работу

    алгоритмов CC на всех частотах очень сложная задача, в некоторых системах

    применяются высокочастотные фильтры, которые срезают компоненты высокой

    частоты. В случае с технологией MultiDrive Sensaura заявляет, что они

    применяют специальные фильтры собственной разработки, которые позволяют

    обеспечить позиционирование источников звука, насыщенными высокочастотными

    компонентами, в тыловой полусфере. Хотя sweet spot должен расшириться и

    восприятие звука от источников в вертикальной плоскости также улучшается, у

    такого подхода есть и минусы. Главный минус это необходимость точного

    позиционирования тыловых колонок относительно фронтальных. В противном

    случае никакого толка от HRTF на четырех колонках не будет.

    Стоит упомянуть и другие инновации Sensaura, а именно технологии ZoomFX

    и MacroFX, которые призваны улучшить восприятие трехмерного звука.

    Расскажем о них подробнее, тем более что это того стоит.

    MacroFX

    Как мы уже говорили выше, большинство измерений HRTF производятся в так

    называемом дальнем поле (far field), что существенным образом упрощает

    вычисления. Но при этом, если источники звука располагаются на расстоянии

    до 1 метра от слушателя, т.е. в ближнем поле (near field), тогда функции

    HRTF плохо справляются со своей работой. Именно для воспроизведения звука

    от источников в ближнем поле с помощью HRTF функций и создана технология

    MacroFX. Идея в том, что алгоритмы MacroFX обеспечивают воспроизведение

    звуковых эффектов в near-field, в результате можно создать ощущение, что

    источник звука расположен очень близко к слушателю, так, будто источник

    звука перемещается от колонок вплотную к голове слушателя, вплоть до шепота

    внутри уха слушателя. Достигается такой эффект за счет очень точного

    моделирования распространения звуковой энергии в трехмерном пространстве

    вокруг головы слушателя из всех позиций в пространстве и преобразование

    этих данных с помощью высокоэффективного алгоритма. Особое внимание при

    моделировании уделяется управлению уровнями громкости и модифицированной

    системе расчета задержек по времени при восприятии ушами человека звуковых

    волн от одного источника звука (ITD, Interaural Time Delay). Для примера,

    если источник звука находится примерно посередине между ушами слушателя, то

    разница по времени при достижении звуковой волны обоих ушей будет

    минимальна, а вот если источник звука сильно смещен вправо, эта разница

    будет существенной. Только MacroFX принимает такую разницу во внимание при

    расчете акустической модели. MacroFX предусматривает 6 зон, где зона 0 (это

    дистанция удаления) и зона 1 (режим удаления) будут работать точно так же,

    как работает дистанционная модель DS3D. Другие 4 зоны это и есть near field

    (ближнее поле), покрывающие левое ухо, правое ухо и пространство внутри

    головы слушателя.

    Этот алгоритм интегрирован в движок Sensaura и управляется

    DirectSound3D, т.е. является прозрачным для разработчиков приложений,

    которые теперь могут создавать массу новых эффектов. Например, в авиа

    симуляторах можно создать эффект, когда пользователь в роли пилота будет

    слышать переговоры авиа диспетчеров так, как если бы он слышал эти

    переговоры в наушниках. В играх с боевыми действиями может потребоваться

    воспроизвести звук пролетающих пуль и ракет очень близко от головы

    слушателя. Такие эффекты, как писк комара рядом с ухом теперь вполне

    реальны и доступны. Но самое интересное в том, что если у вас установлена

    звуковая карта с поддержкой технологии Sensaura и с драйверами,

    поддерживающими MacroFX, то пользователь получит возможность слышать

    эффекты MacroFX даже в уже существующих DirectSound3D играх, разумеется, в

    зависимости от игры эффект будет воспроизводиться лучше или хуже. Зато в

    игре, созданной с учетом возможности использования MacroFX. Можно добиться

    очень впечатляющих эффектов.

    Поддержка MacroFX будет включена в драйверы для карт, которые

    поддерживают технологию Sensaura.

    ZoomFX

    Современные системы воспроизведения позиционируемого 3D звука

    используют HRTF функции для создания виртуальных источников звука, но эти

    синтезированные виртуальные источники звука являются точечными. В реальной

    жизни звук зачастую исходит от больших по размеру источников или от

    композитных источников, которые могут состоять из нескольких индивидуальных

    генераторов звука. Большие по размерам и композитные источники звука

    позволяют использовать более реалистичные звуковые эффекты, по сравнению с

    возможностями точечных источников звука. Так, точечный источник звука

    хорошо применим при моделировании звука от большого объекта удаленного на

    большое расстояние (например, движущийся поезд). Но в реальной жизни, как

    только поезд приближается к слушателю, он перестает быть точечным

    источником звука. Однако в модели DS3D поезд все равно представляется, как

    точечный источник звука, а значит, страдает реализм воспроизводимого звука

    (т.е. мы слышим звук скорее от маленького поезда, нежели от огромного

    состава громыхающего рядом). Технология ZoomFX решает эту проблему, а также

    вносит представление о большом объекте, например поезде как собрание

    нескольких источников звука (композитный источник, состоящий из шума колес,

    шума двигателя, шума сцепок вагонов и т.д.).

    Для технологии ZoomFX будет создано расширение для DirectSound3D,

    Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28


    Приглашения

    09.12.2013 - 16.12.2013

    Международный конкурс хореографического искусства в рамках Международного фестиваля искусств «РОЖДЕСТВЕНСКАЯ АНДОРРА»

    09.12.2013 - 16.12.2013

    Международный конкурс хорового искусства в АНДОРРЕ «РОЖДЕСТВЕНСКАЯ АНДОРРА»




    Copyright © 2012 г.
    При использовании материалов - ссылка на сайт обязательна.