Dolby Digital

Nuvola apps important recycle.svg
Ця стаття або розділ потребує переробки.
Будь ласка, поліпшите статтю відповідно до правилами написання статей.
Кіноплівка з цифровим і аналоговим звуком
Зліва направо: Sony Dynamic Digital Sound (SDDS); Dolby Digital (між отворів перфорації); аналоговий оптичний; мітки ( DTS).

Dolby Digital (AC-3, ATSC A/52) (Долбі Діджитал) - система цифрового багатоканального звуку для кінематографа, розроблена фірмою "Dolby Laboratories, Inc." в 1991 [1].

Формат стандартизований Advanced Television Systems Committee, йому присвоєно код A/52, Dolby Digital (DD) є торговою маркою.

Сучасні системи Dolby Digital надають шість каналів об'ємного цифрового звуку. Лівий, центральний і правий фронтальні канали дозволяють визначити позицію джерела звуку на екрані. Окремі "розділені" лівий і правий задні бічні канали підсилюють відчуття присутності, створюючи об'єм. А додатковий низькочастотний канал додає напруження дії на екрані.

Звукова доріжка Dolby Digital кодується оптично прямо на кінострічку в проміжках між перфораційними отворами. Розміщення цифровий звукової доріжки на тому ж носії, що і фільм, дозволяє їй співіснувати разом з аналогової доріжкою без залучення додаткових носіїв даних, а також забезпечує синхронність зображення і звуку. В кінотеатрах системи IMAX звук записується на окремому жорсткому диску і синхронізується з кіноплівкою за допомогою тимчасового коду SMPTE.


1. Кодер системи Dolby AC-3

П:
У Вікіпедії є портал
"Цифровий звук"

Цифровий потік на виході кодера являє собою послідовність аудіофреймов (Pack AC-3 Frame). Міститься в ньому інформація умовно може бути розділена на дві частини: основну (Main Information) і додаткову (Side Information).

Аудіофрейм кодера включає шість аудіоблоков. Кожен аудіоблок містить інформацію про 512 відліках для кожного з кодованих сигналів (Audio 1, Audio 2, ..., Audio n). Внаслідок 50% тимчасового перекриття в аудіоблок для кожного з сигналів включаються 256 відліків попереднього блоку і 256 нових відліків. У шести аудіоблоках аудіофрейма загальне число оброблюваних відліків для кожного з вхідних сигналів буде одно 512 6 = 3072. Зауважимо, що якщо число кодованих звукових сигналів одно 5 (формат 3/2), то загальне число відліків, інформація про які міститься в одному аудіофрейме, складе (512 5) 6 = 15 360, проте з урахуванням 50% тимчасового перекриття тут буде лише 15360 2 = 7680 нових відліків.

Після сегментації по часу вибірки отсчетов звуковий сигнал кожного каналу перетвориться в нову сукупність цифрових даних за допомогою модифікованого дискретного косинусного перетворення (МДКП). Сегментація звукових сигналів за часом з 50%-вим перекриттям вибірок та їх перетворення з тимчасової в частотну область виконуються в блоці час-частотного перетворення (Frequency Domain Transform). Перед ортогональним перетворенням вибірки отсчетов звукових сигналів зважуються віконної функцією. Остання представлена ​​в стандарті А/52 таблицею.

Перетворення вибірки звукового сигналу з тимчасової області може бути виконане за допомогою одного довгого (512-точкового) або двох коротких (256-точкових) перетворень. У першому випадку буде отримано 256, а в другому - відповідно 128 + 128 коефіцієнтів МДКП. При короткій вибірці коефіцієнти МДКП обох сегментів, що містять по 128 значень, об'єднуються в один загальний блок шляхом їхнього чергування. У цьому загальному блоці будуть також 256 коефіцієнтів МДКП.

Довге перетворення найвпевненіше для сигналів, повільно змінюються по амплітуді з плином часу. Воно має краще дозвіл по частоті. Коротке перетворення забезпечує краще дозвіл за часом і застосовується для сигналів, амплітуди яких швидко змінюються в часі, наприклад в області атаки звуку. Прапор Block Switch Flags (blksw flags) вказує, яке перетворення (довге чи коротке) застосовано при розрахунку коефіцієнтів МДКП. Параметр Block Switch Flags включається у вихідний потік цифрових даних як додаткова інформація і використовується декодером при виконанні зворотного ортогонального перетворення.

При малих швидкостях передачі цифрових даних в кодере Dolby AC-3 передбачено використання спеціальної процедури об'єднання канальних сигналів (Coupling), що дозволяє при їх кодуванні обійтися меншим числом бітів.

В системі Dolby AC-3 кожен коефіцієнт МДКП представляється у форматі з плаваючою комою двома значеннями: експонентою (або порядком) і мантиси: Xd [k] = A [k] 2-B [k], де A [k] і B [k] - відповідно мантиса і порядок k-го коефіцієнта перетворення. Порядок дорівнює числу нулів перед першою одиницею двійкового представлення коефіцієнта МДКП. Він є по суті справи його масштабним коефіцієнтом (або нормує множником). Наприклад, якщо коефіцієнт МДКП Xd [k] = 0,158 і його двійкове представлення записується як 0,001010000110, то порядок (масштабного коефіцієнта) B [k] = 2, а мантиса дорівнює 0,1010000110 в двійковій або A [k] = 0, 6308 в десятковій системах числення. Знак коефіцієнта МДКП враховується при кодуванні мантиси. Перед кодуванням Мантіс нормуються (Normalize Mantissas). Експоненти і мантиси коефіцієнтів МДКП кодуються окремо в блоках Encode Exponent і Quantisse, Encode Mantissas.

У блоці розподілу бітів (Bit Allocation) враховується ефект маскування. В основі процедури виділення бітів лежить модель слуху, що дозволяє оцінити максимально допустимий (порогове) значення рівня шуму, який ще маскується корисним сигналом в смузі кодування, і у відповідності з даними цих розрахунків виділити при кодуванні мантисс коефіцієнтів МДКП відповідне число розрядів. Всі зазначені обчислення виконуються в блоці, званому зазвичай психоакустической моделлю. Кожна нормована мантиса квантуется з числом ступенів квантування, відповідним числу бітів, визначеному в модулі Bit Allocation.

Порядок кодування коефіцієнта МДКП в кодере Dolby AC-3 являє собою число, яке змінюється в межах від 0 до 24. Тому кодове слово порядку повинно мати принаймні m = 5 розрядів (2 5 = 32). Максимальний порядок в кодере обмежується значенням 24.

Відомо, що якщо спектр вибірки звукового сигналу аналізується за допомогою банку фільтрів, кожний з яких має досить вузьку смугу частот, то різниця в рівнях енергії сигналу між сусідніми фільтрами рідко перевищує значення 12 dB. Ця обставина врахована при кодуванні порядків. При кодуванні порядків в кодере системи Dolby AC-3 застосований метод диференціальної імпульсно-кодової модуляції, коли кодується не сам порядок, а різниця між значеннями порядків сусідніх коефіцієнтів МДКП.Первое значення порядку для сигналу кожного каналу в найпершій найбільш низькою за частотою смузі аналізу - це завжди четирехбітовое кодове слово, що відповідає діапазону зміни чисел від 0 до 15. Порядок у наступній вгору по частоті смузі аналізу визначається як різниця між поточним і попереднім значеннями порядків відповідних коефіцієнтів МДКП. У кодере Dolby AC-3 роздільна здатність диференціальної імпульсно-кодової модуляції (дискретність зміни порядків) при кодуванні обмежена значеннями -2, -1, 0, +1, +2. Максимальна зміна порядків сусідніх коефіцієнтів МДКП становить 2, що відповідає 12 dB.

Диференціальне значення порядків коефіцієнтів МДКП об'єднуються в групи. Для процедури групування використовуються три можливих стратегії, позначені в стандарті як D15, D25 і D45. У стратегії D15 кожна пара, а в стратегії D45 вже кожна четвірка диференціальних значень порядків представлені одним значенням числа M в потоці цифрових даних.

Диференціальні значення порядків, отримані безпосередньо з вихідних коефіцієнтів МДКП, на практиці не завжди дають максимальну різницю сусідніх коефіцієнтів, що не перевищує діапазон 2, що вимагають відповідні таблиці стандарту Dolby AC-3. Тому перед кодуванням необхідна додаткова обробка масиву порядків. З її допомогою зменшуються деякі значення порядків, але при цьому змінюються і відповідні їм значення мантисс так, що в їх двійковому поданні попереду з'являються нулі. Після виконання цієї операції максимальний диференційний порядок вже не буде перевищувати необхідне значення, рівне 2.

Вибір стратегії (D15, D25 або D45) кодування порядків коефіцієнтів МДКП - це компроміс між хорошим частотним дозволом, дозволом за часом і числом бітів, необхідних для кодування експонент. Стратегії D15 і D25 можуть бути використані для кодування сигналів, мають нерівномірний спектр, коли значення зкспоненти змінюється досить швидко від однієї смуги аналізу до іншої. Якщо ж спектр сигналу достатньо гладкий (плоский), тоді використовуються стратегії кодування D45.

Після вибору стратегії кодування порядків кодер Dolby AC-3 об'єднує кодові слова, відповідні диференціальним значенням експонент, в групи. Для всіх режимів роботи кодера набори чисел M для трьох сусідніх (k, k + 1, k + 2) коефіцієнтів МДКП M [k], M [k + 1], M [k + 2] групуються і кодуються як одне семібітовое слово по правилом:

M [k, k +1, k +2] = {25M [k]} + {5M [k + 1]} + M [k + 2].

Діапазон зміни мантисс коефіцієнтів МДКП лежить в межах від -1 до +1. Знак коефіцієнта МДКП враховується при кодуванні мантиси. Процес квантування мантисс коефіцієнтів МДКП в стандарті Dolby AC-3 має такі особливості:

  • число можливих ступенів квантування відповідає наступному ряду чисел: 0, 3, 5, 7, 11, 15, 32, 64, 128, 256, 512, 1024, 2048, 4096, 16384, 65536; використовується рівномірне квантування мантис;
  • при числі ступенів квантування, рівному 3, 5, 7, 11 і 15, використовується так зване симетричне квантування, у всіх інших випадках - асиметричне;
  • при числі ступенів квантування, рівному 3, 5 і 11, кодові слова мантисс об'єднуються в групи. При трьох щаблях квантування три кодових слова, що відповідають трьом значенням мантис, кодуються одним пятібітовим кодовим словом. При п'яти ступнях квантування три кодових слова мантисс групуються і кодуються одним семібітовим кодовим словом. При 11 ступенях квантування два кодових слова мантисс групуються і кодуються одним семібітовим кодовим словом; в інших випадках процедури групування немає.

При симетричному квантуванні замість квантованих значень мантис в цифровий потік включені їх індекси, задані відповідною таблицею. Наприклад, якщо число ступенів квантування дорівнює 3, а значення мантиси лежить в межах від -1 до -1 / 3, то передаватися до декодеру буде значення, рівне -2 / 3, і йому буде відповідати індекс mc = 0. Якщо значення мантиси лежить в інтервалі від -1 / 3 до +1 / 3, то декодеру передається значення, рівне нулю, і кодується індекс mc = 1. І нарешті, якщо значення мантиси знаходиться в інтервалі від +1 / 3 до +1, то декодеру передається значення, рівне +2 / 3, і кодується відповідний йому табличний індекс mc = 2. Аналогічним чином у формі таблиць задаються інтервали значень мантис і відповідні їм індекси для числа ступенів квантування рівних відповідно 5, 7, 11 і 15. Такий спосіб квантування дозволяє зменшити число необхідних бітів. Для всіх інших ступенів квантування (32, 64, ..., 65536) кодуються не індекси, а самі мантиси коефіцієнтів МДКП.

Наступним етапом є кодування та упаковка в цифровий потік табличних індексів квантованих значень мантис. При симетричному квантуванні для зменшення необхідного для кодування індексів числа бітів використовується додатково процедура групірованія. Наприклад, при числі ступенів квантування, рівному 7, індекс мантиси змінюється в межах від 0 до 6. Для кодування цього ряду чисел потрібно 3 біти. При 11 ступенях квантування табличний індекс мантисс лежить в інтервалі від 0 до 10, а при 15 ступенях квантування він перебуває вже в інтервалі від 0 до 14. При цьому необхідне для кодування кожного з них число бітів відповідно дорівнює 4 або 5. Групування табличних індексів дозволяє зменшити необхідну для їх кодування число бітів при 3, 5 і 11 ступенях квантування. При 3 і 5 ступенях квантування три табличних індексу мантис, а при 11 ступенях квантування два табличні індексу мантисс кодуються одним кодовим словом за наступними правилами:

 Group_code [3] = 9mc [a] + 3mc [b] + mc [c]; Group_code [5] = 25mc [a] + 5mc [b] + mc [c]; Group_code [11] = 11mc [a] + mc [b], 

де Group_code [3], Group_code [5] і Group_code [11] - кодові слова груп табличних індексів мантисс відповідно при 3, 5, 11 ступенях квантування; mc [a], mc [b], mc [c] - табличні індекси мантисс коефіцієнтів МДКП з номерами a, b і c. Отже при трьох ступенях квантування мантис (n = 3) кодове слово групи, що складається з трьох індексів, буде містити 5 бітів, тому на кодування кожної мантиси в цьому випадку буде витрачено 5 3 = 1,67 біта. При n = 5 кодове слово групи мантисс буде представлено вже семібітовим числом, і на кодування кожної мантиси буде потрібно вже 7 3 = 2,33 біта. І нарешті, при n = 11 на кодування кожної мантиси буде потрібно вже 7 2 = 3,5 біта, а при n = 15 - 4 біти і т. д.

У кодере визначається довжина кодового слова кожної мантиси або відповідного їй табличного індексу, після чого мантиси розпаковуються за спеціальною процедурою.

При роботі в режимі об'єднання звукових сигналів кодер об'єднує високочастотні частини вихідних сигналів в певній смузі частот в один загальний сигнал і генерує додатково так звані координати об'єднання. Останні будуть використані декодером для відновлення енергетичних співвідношень високочастотних частин спектра кожного вихідного сигналу, підданого процедурі об'єднання. Після декодування об'єднані частини в кожному з відновлених сигналів матимуть однаковий спектральний склад і відрізнятися тільки рівнем.

Кодер формує загальний сигнал шляхом простого складання коефіцієнтів МДКП поєднуваних сигналів. При цьому коефіцієнти МДКП з 37-го по 252-й групуються в 18 субполос (так званих смуг об'єднання) по 12 коефіцієнтів у кожній такій субполосе. Нижня і верхня частотні межі смуг об'єднання задаються користувачем. Координати об'єднати розраховуються для кожного об'єднання субполосного сигналу. Вони являють собою відносини максимальних коефіцієнтів МДКП кожного об'єднує сигналу і сумарного сигналу в субполосе об'єднання. Далі координати об'діненія перетворюються в формат чисел з плаваючою комою і включаються у вихідний потік даних як додаткова інформація. Сумарний (об'єднаний) сигнал кодується так само, як і сигнал незалежних каналів.


2. Декодер системи Dolby AC-3

Декодер Dolby AC-3 отримує порядки коефіцієнтів МДКП в кодованому і упакованому вигляді. Щоб їх розпакувати і декодувати, необхідно мати додаткову інформацію про числі переданих експонент в сигналі кожного каналу і про стратегії їх кодування (D15, D25, D45), що використовувався в кодере. Процес декодування порядків здійснюється в блоці декодування експонент (Decode Exponent). Після декодування порядків виконується процедура розпакування, деквантованія і денормірованія мантисс коефіцієнтів МДКП (Dequantize, Denormalize Mantissas). Для її виконання використовуються параметри психоакустичної моделі, параметри, що визначають розподіл бітів в кодере, а також відновлення значення порядків коефіцієнтів МДКП. Операція денормірованія мантисс проводиться за допомогою зрушень розрядів кодового слова мантиси вправо. При цьому число зрушень визначається порядком відповідного коефіцієнта МДКП. Якщо в кодере була використана процедура об'єднання сигналів ряду каналів, то, очевидно, декодер повинен виконати зворотну операцію (De-Coupling), використовуючи передані декодеру в поле даних додаткової інформації значення координат об'єднання. У блоці зворотного ортогонального МДКП (Inverse Transform) здійснюється зворотне перетворення реконструйованого в декодері сигналу у тимчасову область.

SI BSI Audio Block 0 Audio Block 1 Audio Block 2 Audio Block 3 Audio Block 4 Audio Block 5 AUX Data CRC

Схема 1.Структура даних аудіофрейма системи Dolby AC-3.


Block Switch Flags Dither Flags Dynamic Range Control Coupling Strategy Coupling coordinates Exponent strategy Exponent Bit Allocation Parametrs Mantissas

Схема 2.Структура даних аудіоблока системи Dolby AC-3.

Структура аудіоданих в стандарті Dolby AC-3 показана на схемі 1.Поле даних заголовка (Header) аудіофрейма містить інформацію про синхронізацію SI (Syncronizator Information) і інформацію про конфігурацію потоку даних BSI (Bit Stream Information).

Поле даних SI включає сінхрослово (0000 1011 0111 0111, або OB77h), біти завадостійкого кодування (CRC - код), частоту дискретизації і розмір аудіофрейма. Аудіофрейм системи Dolby AC-3 включає два 16-бітових слова CRC-коду, перше з них слід на початку кожного фрейма після слова синхронізації, а друге - в його кінці. Поле даних BSI містить інформацію про конфігурацію потоку цифрових даних, наприклад, таку, як тип сервісу, режим роботи кодера (тобто число кодованих сигналів або тип звукового формату), абсолютний акустичний рівень сигналу кожного каналу, інформацію про мову, про час та інше.

Структура даних аудіоблока показана на схемі 2.Он включає в себе наступні поля бітів: Block Switch Flags - параметр довжини ортогонального перетворення; Dither Flags - ознака наявності додаткового шуму; Dynamic Range Control - дані управління динамічним діапазоном переданих сигналів; Coupling Strategy - інформація про об'єднання сигналів (сигнали яких каналів об'єднані і починаючи з якою частоти); Coupling Coordinats - координати об'єднання для сигналу кожного каналу; Exponent Strategy - обрана стратегія кодування порядків; Exponents - кодові слова порядків коефіцієнтів МДКП; Bit Allocation Parametrs - параметри психоакустичної моделі; Mantissas - кодові слова мантисс коефіцієнтів МДКП.


3. Технології Dolby Digital

3.1. Dolby Digital EX

EX - це приставка, що використовується для позначення систем звуку Dolby Digital c 6.1 каналами: двох фронтальних, центрального, низькочастотного, тилового об'ємного звучання і двох бічних об'ємного звучання.

3.2. Dolby Digital Surround-EX

L1 g dolbydsurroundex.gif

Dolby Digital Surround-EX додає звуковій доріжці третій канал об'ємного звуку. Ідея належить звукорежисерам студії Skywalker Sound. Технологія розроблена спільно з Dolby Laboratories і Lucasfilm THX.

3.3. Dolby Digital Live

Dolby Digital Live (DDL) - технологія кодування багатоканального (5.1) аудіосигналу в формат AC3 в реальному часі, запропонована компанією Dolby Technologies. Призначена для передачі багатоканального звуку з ігор та інших додатків на ресівер по інтерфейсу S / PDIF (оптичного або коаксіального).

Її використання дозволяє позбавитися від обмежень, через які по цифровим інтерфейсам могли передаватися тільки вже готові (тобто зберігаються закодованими в формат AC3 або DTS) багатоканальні доріжки, зазвичай є звуковим супроводом фільмів), а в іграх можливості цифрового виходу обмежувалися звичайним стереозвуком. (Для повноцінного 5.1 в іграх в таких випадках потрібно трипровідних аналогове підключення, якщо воно, звичайно, можливо.)

Принциповим і непереборним недоліком технології DDL є якась втрата якості звуку від стиснення його в AC3 формат (порівнянна з переходом від CD-Audio до mp3 з високим бітрейтом) що, проте абсолютно некритично для основного передбачуваного її застосування.

В даний час ця технологія зустрічається переважно в материнських платах, оснащених кодеками Realtek ALC882D, ALC888DD і ALC888H, а також з деякими кодеками C-Media. Такі плати можна знайти по фразах "AC3 Encode" або власне "Dolby Digital Live" в описах товару.

Також ця технологія починає впроваджуватися в ноутбуки, де в умовах дефіциту місця для "зайвих" аналогових роз'ємів обіцяє найбільші переваги - один роз'єм дозволить отримати повноцінний 5.1 звук у всіх додатках за умови підключення ноутбука до ресівера або набору активних колонок з вбудованим декодером.

З окремих звукових карт з підтримкою цієї технології варто відзначити Terratec Aureon 7.1, а в популярних звукових картах сімейства Creative X-Fi підтримка DDL відсутня, але (за неофіційною інформацією) у майбутньому не виключено її введення заднім числом при виході нової версії драйверів.


На 2010 рік з сімейства Creative X-Fi можна виділити наступні моделі з підтримкою цієї технології: CREATIVE X-Fi Titanium 7.1, CREATIVE X-Fi Titanium Fatal1ty Pro 7.1, CREATIVE X-Fi Titanium Fatal1ty Champion 7.1


3.4. Dolby Digital Plus

Дітище компаній MIPS Technologies і Dolby Laboratories.

Особливості:

  • Багатоканальний звук з незалежними каналами
  • Підтримується до 7.1 каналів * і можливість наявності декількох аудіо програм в одному потоці
  • Висновок потоку Dolby Digital для сумісності зі старими пристроями
  • Максимальна швидкість потоку до 6 Mbps
  • Бітрейт від 3 Mbps на HD DVD і до 1.7 Mbps на Blu-ray Disc
  • Підтримується HDMI
  • В одному потоці може містяться матеріал на різних мовах
  • Нові можливості при кодуванні для аудіо професіоналів
  • Збереження високої якості на більш ефективних для радіомовлення швидкостях передачі даних (200 Kbps для 5.1 каналів)

'Dolby Digital Plus підтримує більше 8 аудіо каналів. Стандарти HD DVD і Blu-ray Disc зараз обмежують це число до 8.


3.5. Dolby TrueHD

Dolby TrueHD є форматом звуку стисненого без втрат за алгоритмом Meridian Lossless Packing (MLP). Характеристики звуку, стисненого за стандартом:

  • до 14 каналів з потоку, хоча найчастіше сьогодні використовуються у фільмах на Blu-ray дисках: 6 (5.1) каналів і максимум 8 (7.1), а підтримується відтворення з боку AV-ресіверах - 8 каналів (7.1);
  • розрядність до 24 біт і частота дискретизації 192 кГц (що і для носія Blu-ray - 18 Мбіт / с), хоча для фільмів на Blu-ray поширено до 8 каналів з 24 біт та 96 кГц при стискуванні до потоку при стисненні 63 Мбіт / з або - 6 каналів з ​​24 біт і 192 кГц при стисненого потоку до 18 Мбіт / с [2].

3.6. Технології Dolby на оптичних носіях

HD DVD Blu-ray Disc DVD-Video DVD-Audio Лазердіск
Кодек Апаратна підтримка Число каналів (макс.) Макс. швидкість потоку Апаратна підтримка Число каналів (макс.) Макс. швидкість потоку Апаратна підтримка Число каналів (макс.) Макс. швидкість потоку Апаратна підтримка Число каналів (макс.) Макс. швидкість потоку Апаратна підтримка Число каналів (макс.) Макс. швидкість потоку
Dolby Digital Обов'язково 5.1 504 кбіт / с Обов'язково 5.1 640 кбіт / с Обов'язково 5.1 448 кбіт / с Додатково в відеочасті для сумісності зі звичайними DVD-плеєрами 5.1 448 кбіт / с Додатково 5.1 384 kbit / s
Dolby Digital Plus 7.1 3 Мбіт / с Додатково 7.1 1.7 Мбіт / с
Не використовується
Dolby TrueHD 8 18 Мбіт / с 8 18 Мбіт / с

4. Цікаві факти

Примітки

  1. Про багатоканальному звуковідтворення, 2008, с. 15
  2. по HD-звуку. - www.thg.ru/video/hd_audio_i/hd_audio_i-01.html # link9


Література

  • Д. Г. Чекалін Про багатоканальному звуковідтворення - www.mtk-magazine.ru/file/MTK_8.pdf / / "Світ техніки кіно": журнал. - 2008. - № 8. - С. 14-19.
  • Digital Audio compression Standart (AC-3) / Doc.A/52, 1995-12-20
  • І. А. Алдошина, Е. І. Вологодін, А. П. Єфімов та ін Електроакустика та звукове мовлення: навчальний посібник для вузів / Під редакцією Ю. А. Ковалгіна. - М.: Гаряча лінія-Телеком, Радіо і зв'язок, 2007. - 872 с.: Іл.