Сучасні багатоканальні системи. Як визначити, чи є звукова доріжка мікшуванням Dolby Pro Logic II Інші багатоканальні системи

Також відомий як:

Dolby Pro Logic - удосконалена схема декодування, використана в Dolby Surround. Вона відрізняється тим, що забезпечує отримання центрального каналу, кращий поділ сигналів і точніший збіг локалізації звуків відповідно до того, що відбувається на екрані. Найменування Dolby Surroundвідноситься до обох систем декодування: як до Dolby Surround, так і Dolby Pro Logic. Хоча існують два типи декодерів Dolby Surround, що кодує пристрій виготовляється лише в одному варіанті. Носії формату Dolby Surroundпрацюють із декодерами обох типів. Декодери Dolby Surroundзначною мірою виявились витісненими декодерами Pro Logic.

Крім декодування вихідного двоканального звукового сигналу відеомагнітофона чи програвача лазерних дисківдля отримання звукових сигналівлівого, центрального, правого каналів і оточення декодер Pro Logic зазвичай формує шостий вихідний сигнал, призначений для сабвуфера. Він є монофонічним сигналом зі смугою частот, обмеженою зверху 100 Гц, в якому об'єднана інформація фронтальних каналів. Використовувати цей сабвуферний сигнал необов'язково; Багато систем домашнього кінотеатру для відтворення повного спектру звукового сигналу, включаючи і низькі частоти, застосовують широкосмугові гучномовці лівого та правого каналів.

Зверніть увагу, що для передачі сабвуферного сигналу не використовується спеціальний канал. Навпаки, цей сигнал створюється шляхом змішування низькочастотних сигналів фронтальних каналів, завдяки чому лівої та правої акустичним системам не потрібно відтворювати бас, і вони можуть мати невеликі габарити.

Важливо розуміти, що Pro Logic забезпечує роботу чотирьох каналів звуковідтворення (лівого, центрального, правого та монофонічного тилового). Хоча використовується два тилові гучномовці, на них подається той самий монофонічний сигнал.

Всі декодери Dolby Digital незалежно від того чи є вони 5.1-сумісними або двоканальними, мають унікальну можливість downmixing`а для сумісності з будь-якою системою відтворення. На ваш вибір декодер може в реальному часі створювати з Dolby Digital 5.1:

двоканальне Dolby Surroundстерео для відтворення у системах домашнього кінотеатру формату Dolby Surround Pro Logic ;
двоканальне стерео для звичайного стереообладнання та прослуховування у навушниках;
монофонічний сигнал для виведення телевізора.

Для лазерних дисків downmixing не використовується, оскільки вони містять окремі звукові доріжки:

PCM для відтворення на звичайному стереообладнанні або Dolby Surround Pro Logic;
FM для відтворення моно; FM у форматі 5.1

Передати просторові звукові відчуття – завдання з багатьма варіантами рішень. Ми неодноразово стикалися з ідеалізацією звукових систем, розмовами про повноцінний багатоканальний звук, який переносить слухача в заданий акустичне місце з безліччю локалізованих джерел. Але, на жаль, це поки що не реально.

Поки що, можна говорити лише про одну успішну реалізацію, найближчу до наших реальних відчуттів - бінауральну. Для отримання повноцінної об'ємної інформації за її допомогою слухач повинен знаходитись у навушниках. Досвідчена модель, на основі якої будувалися основні дослідження, являла собою манекен, де замість правого та лівого вуха були встановлені мікрофони. За результатами складалася складна математична модель, яка дозволила створювати віртуальні звукові світи.

Але ці дослідження, хоч і були близькими до ідеалу, мали досить загальні результати. Адже, погодьтеся, у кожної людини різна форма вушних раковин, а відстань між правим та лівим вухом – це також індивідуальний параметр. Загалом, дослідники зайшли в глухий кут. Практичне застосування результатів бінауральних моделей зараз пропонується у варіанті субкультури, що розвивається окремо від основних напрямків, що застосовуються на практиці.

Хоч як це дивно, але найважливіший внесок у сфері просторового звуку зробила кіноіндустрія. У процесі свого розвитку вона стикалася з багатьма проблемами, і не можна сказати, що її шлях був гладким. На впровадження нових технологій витрачалися великі гроші, і не завжди такі вкладення виправдовувалися. Як приклад можна навести стереокіно, де глядачам пропонувалося надягати спеціальні окуляри, щоб дивитися зображення обсягом. Стереокіно не стало стандартом, і навіть гірше – воно повністю не прижилося. Тому ідеалізовані бінауральні варіанти із навушниками – технологія не для кіновиробництва.

Dolby

Як варіант – це багатоканальна система. Спочатку кіно було німим, потім прийшов моно звук, і наступний етап - стерео... Стерео увірвалося з великою кількістю нових ідей та їх реалізації. Простий поворот ручки панорами захоплював глядачів і слухачів. Що цікаво, до 80-х поняття "stereo" та "surround" були синонімічні. А знаєте, коли поділилися? З переходом стандарту кіноплівки із 35 мм на 70 мм. Спочатку, виробники стали використовувати так званий канал ефектів (effect channel) - це позаду слухачів гучномовець, призначений для озвучування допоміжних звуків, а часто і просто мовчить, оскільки місце на 35 мм-плівці було обмежене. З використанням стандарту 70 мм, канал ефектів став працювати постійно і був перейменований в просторовий канал (surround channel, далі називатимемо його як S-канал). І з цього моменту можна сказати про поділ понять "stereo" та "surround". У варіанті 35 мм-плівки було запропоновано стандарт Dolby Stereo (середина 70-х). У 1982 році на ринок надійшли перші Dolby Surround пристрої. Коштували вони тоді як апаратура hi-end-класу і були доступні дуже невеликій кількості громадян.

Паралельно з кіноіндустрією розвивалися відеоіндустрія та кабельне/супутникове телебачення. Можливість забезпечити об'ємний звук у домашніх умовах – одне з основних завдань, яке було поставлено перед виробниками. З'явилися більш адекватні як за ціною, і по реалізації варіанти декодерів Dolby Pro Logic і Pro Logic II. Останній дозволяв не лише відтворити закодований об'ємний звук, а й слухати музику зі звичайного CD, розкладаючи його на surround-систему. Pro Logic і Pro Logic II є перехідними містками між звичайними стерео-системами та багатоканальним surround. Утрируя деякі особливості можна сказати, що в чомусь вони (стерео і surround у варіантах декодерів Dolby Surround - Pro Logic і Pro Logic II) взаємозамінні.

З активним впровадженням цифрових технологій Dolby Labs є стандартом Dolby Digital AC-3 (5.1), розроблений для 35 мм плівки. Особливістю Dolby Digital 5.1 є наявність двох surround-каналів (правого (RS) та лівого (LS), у попередників S-канал був один, хоча гучномовців встановлювалося кілька) та сабвуфером. Якщо говорити про абревіатуру "5.1", то вона розшифровується не лише як п'ять каналів та сабвуфер. Справа в тому, що в Dolby Digital вперше фронтальні та S-канали мали однаковий повний частотний діапазон. Наприклад, Dolby Pro Logic S-канал передбачав діапазон від 100 Гц до 7КГц. Тепер ми говоримо про п'ять повноцінних каналів з діапазоном 20 Гц - 20 КГц і вище. Частотний діапазон сабвуфера або як його ще називають LFE-канал (Low Frequency Effect) є обмеженим і становить приблизно 0,1 від частотного діапазону п'яти каналів, тому "5.1" слід розшифровувати як "п'ять і одна десята".

Файли Dolby Digital 5.1 мають розширення *.ac3 і вимагають для свого розшифрування спеціальний декодер (програмний або апаратний). На зорі свого розвитку технологія коштувала дуже недешево. Декодери були тільки апаратні та випускалися у вигляді спеціалізованих пристроїв. Тепер ситуація змінилася на краще, і звичайний користувач може собі дозволити придбання звукової карти зі вбудованими декодерами або завантажити їх програмний варіант з інтернету. Таким чином, сучасний кінотеатр і домашній кінотеатр повністю зрівнялися за можливостями. Варто відзначити ще один важливий аспект.

Поряд з розвитком кіно, відео та телебачення, відкрився новий спектр застосування технології surround-звуку – відео та комп'ютерні ігри. Якщо раніше ми говорили про найпростіші варіанти 3D-движка, заснованому на регулювання фазових зрушень, затримок і найпростішої еквалізації, то тепер маємо на увазі повноцінний 5.1 як мінімум.

На сьогодні Dolby Digital 5.1 є найуніверсальнішим стандартом. Звук АС-3 може бути змінено залежно від масштабів апаратури. Наприклад, крім доступного поділу на п'ять або шість каналів (залежно від наявності/остутсвія сабвуфера), він може перетворюватися на чотири канали (Dolby Pro Logic), зазвичай стерео і навіть моно. Тому, кодуючи звук для комп'ютерних ігор в Dolby Digital 5.1 можна не боятися того, що користувач, який має меншу кількість колонок, буде почуватися незатишно.

Звичайно, кінотеатрам потрібно мати перевагу в порівнянні з домашніми комплексами, тому спеціально для них була розроблена технологія Dolby EX, яка має на увазі ніщо інше як 6.1. Крім окремих S-каналів для правого та лівого (RS та LS) у ній передбачений S-канал центрального (CS). Технологія Dolby Digital дозволяє компресувати дані та передавати їх потоком із мінімальною швидкістю передачі 320 kbps (стандарт - 384 kbps). Звичайно, стислі дані є більш транспортабельними і займають менше місця на носіях, чи то кіноплівка, чи звичайний вінчестер. Але дана технологіямає і мінуси - вона розрахована тільки на один цикл кодування-декодування і не вирішує проблеми ретрансляції та редагування стислих даних. Крім цього хоч ми і виграємо в місці, ми програємо в тому, що звук стандарту AC-3 не синхронізований з відео, тому редагування такого матеріалу дуже проблематичне.

Звичайно, потрібно багаторазове кодування/декодування. Вирішенням цієї проблеми стала нова впроваджена технологія Dolby-E. Вона дозволяє передавати, багаторазово кодувати/декодувати вісім каналів із повним частотним діапазоном. Усього допускається десять циклів кодування/декодування. Крім іншого, стандарт передбачає наявність метаданих - спеціальних інструкцій, що описують основні дані. Крім синхронізації, вони можуть нам повідомити налаштування компресора для кожного каналу тощо. До речі, цими даними можна і не користуватися, вони не більше не менше, а додаткова інформація.

DTS

У більшості користувачів поняття surround асоціюється з Dolby. Це не так. Dolby Digital – більш розкручений бренд, не більше. У середині 80-х Террі Бірд, президент та засновник фірми Nuoptix, об'єднався у команду з Джимом Кетчамом. Завдання, які поставили перед собою експериментатори, були наступними – створити єдиний цифровий звуковий стандарт для кінотеатрів та вирішити питання якісного розміщення багатоканального аудіо на кіноплівці. Спочатку експерименти велися за допомогою цифрових магнітофонів (DAT) та проектора. Вже на початковому етапі розробки вирішувалися питання синхронізації (як ми знаємо, у варіанті Dolby вони вирішилися лише з використанням Dolby-E). Через деякий час замість DAT почали використовувати звичайні CD-ROM. При використанні алгоритму стиснення apt-X100, розробленого Стівеном Смітом та його колегами з Audio Processing Technology, що дозволяє компресувати дані 4:1, один CD-ROM поміщалося 100 хвилин багатоканального аудіо (швидкість передачі даних 884 kbps). Таким чином, на двох дисках міг зберігатися звук для тригодинного художнього фільму.

Після отримання патенту 1990-го мала демонстрація нової технології для членів SMPTE. До 1992 року технологія була показана Стівену Спілбергу, щоправда, на базі вінчестерів, і режисер погодився її застосувати у своїй новій картині "Парк Юрського періоду" ("Jurassic Park"). Студія Universal, яка є господарем картини, вирішила перевірити технологію на кількох двох "менш значущих" фільмах. Результати тестів виявились прийнятними. Більш того - Universal і Стівен Спілберг стали співвласниками з Террі Бірдом нової фірми, що отримала назву Digital Theatre Systems. Лише у той час, коли утворювалася ця компанія (а це зайняло чотири місяці), у кінотеатрах було встановлено 876 систем DTS. На сьогоднішній момент їх понад 19.000 по всьому світу. Було заплановано реалізувати два технологічні стандарти:

DTS-S- DTS-стерео, призначений для кінотеатрів, які хочуть використовувати цифровий звук, але не можуть дозволити собі повноцінний шестиканальний варіант.

DTS-6- три фронтальні канали (лівий L, центральний C, правий R), два S-канали (LS і RS) та сабвуфер. При цьому слід зазначити, що стандарти дещо різні з Dolby. Наприклад частотний діапазон сабвуфера DTS - від 20 до 80 Гц, замість 3 -120 Гц у Dolby Digital.

Однією з головних відмінностей DTS від Dolby Digital є те, що DTS розроблявся для 70 мм кіноплівки. Відповідно, проблема місця не стояла так актуально як у варіанті Dolby Digital, питання реалізації hi-res-звуку та синхронізації вирішувалися практично відразу з часу виникнення стандарту.

Зараз, згадуючи DTS, ми можемо говорити про вісім і більше каналів hi-res-звуку, новітніх технологіях стиснення інформації, та їх активне практичне застосування.

Dolby vs DTS

Стандарти DTS поширені так само як і Dolby. При цьому конкуренти встигають сваритися. А що їм ще робити? У Dolby набагато потужніша підтримка з боку звичайних споживачів і виробників технологій для ринку користувача. Так, у Dolby Surround випускаються музичні альбоми звукозаписними лейблами Delos, RCA Victor/BMG Classic, Concord Jazz. Документація цього стандарту постійно затребувана розробниками сучасних відеоігор. Сучасне супутникове телебачення також мовить здебільшого зі звуком у режимі Dolby Surround. На останньому 114-му з'їзді AES в Амстердамі мали місце навчальні семінари з запису, відомості та майстерингу в Dolby 4.0, 5.0, 5.1, 6.0, 6.1 та 10.2.

DTS залишається привілеєм кіновиробництва. На сьогодні вже успішно вирішено питання з hi-res-аудіо з фантастичними на сьогоднішній день стандартами 64 біти та вище, 192 КГц і вище. До речі, Dolby Digital також дозволяє використовувати hi-res-треки.

Виробниками ПЗ та студійної техніки питання протистояння вирішено дуже просто – підтримується і те, й інше. Це можна побачити і в Steinberg Nuendo – одному з найпрофесійніших та універсальних засобів для виробництва surround-звуку, і в лінійці звукових інтерфейсів Audiotek – MAYA 5.1, 7.1, EX, EX7, PRODIGY 7.1. Там ви зустрінете підтримку відразу двох технологій – Dolby Digital та DTS. Крім цього, стандартні програмні програми, призначені для відтворення звуку DVD також мають декодери для обох стандартів.

Якщо ж подивитися на конфронтацію DTS та Dolby, то іноді доходить до смішного. Dolby випускає прес-реліз - DTS відповідає. Наприклад: "Dolby проводила дослідження на невідомій студії з невідомою апаратурою, при цьому для відтворення використовувався невідомий матеріал, який тестували невідомі фахівці...". Та й іноді, говорячи про surround звук і DVD, Dolby дійсно забувається, привласнюючи основні звершення і т.п. на свою користь. Загалом звичайна корпоративна війна.

Інші багатоканальні системи

В принципі, будь-який користувач, маючи у своєму арсеналі звукову картуз чотирма і більше виходами та професійну мультитрекову програму, може відчути себе на зорі 70-80-х. Саме тоді велися основоположні досліди з багатоканальним звуком. Багатьом відома квадрофонія, була навіть октофонія. При цьому, наприклад, октофонія тоді не мала на увазі сучасних "7.1". Тоді передбачалося наявність 8 незалежних каналів з повним частотним діапазоном, що розставлені навколо слухача по колу на рівних відстанях між собою.

Експериментувати можна скільки завгодно. Як результат досліджень -необхідність якоїсь стандартизації у зведенні та відтворенні. Наприклад, візьмемо варіант октофонії, про який ми згадали трохи вище.

Вихідні дані - ударна установка, записана на 14 мікрофонів і зведена в такий спосіб, щоб слухач, що у центрі отримував відчуття присутності. При зміні положення слухача від центру, гучномовці, що наближаються до нього, будуть гучнішими, баланс і звукова картина зміняться. Таким чином, в одній точці ми чуємо одне, в іншій – інше. Це основний недолік систем такого плану – слухач повинен розташовуватись у центрі.

У варіанті surround нам повідомляється лише просторовий ефект присутності. Тобто локалізація звуку закріплена за окремим каналом. Інші працюють як супроводжуючі. Тобто ми отримуємо емуляцію просторових відчуттів, для чого власне surround-системи і розроблені.

Найунікальніша багатоканальна акустична система - це навушники, в яких можна отримати якісний 3D.

Хоча з іншого погляду, ніколи не варто зупиняти експерименти. У вас є до цього всі можливості. Якщо в середині 90-х для дослідів з квадрофонією мені доводилося підключати до РС дві стерео-плати, то тепер навіть найдешевший звуковий інтерфейс має як мінімум чотири лінійні виходи. Dolby Surround не є ідеальною системою та місця для експериментів дуже багато.

Стандартний кодер Dolby Surround та пасивний декодер

Давайте трохи повернемося до історії, на початку 80-х, коли з'явилися перші Dolby Surround пристрої. Кодер Dolby Surround - це пристрій, що дозволяє перетворити чотири канали (L-лівий, С-центральний, R-правий і S-просторовий) на два кодованих Lt і Rt. Lt і Rt - це абревіатура від L-, R-total, що в перекладі означає загальний. У документаціях до Dolby Surround таке найменування означає закодовані канали для систем Dolby старого покоління. Такі Lt і Rt можуть бути записані на звичайну магнітну плівку та відтворюватись на стрічкових магнітофонах. За наявності декодера, Lt та Rt розшифровуються на багатоканальну систему Surround.

Розгляньмо роботу кодера Dolby Surround на представленій схемі. На рис. 1 відображено як чотириканальна система перетворюється на двоканальну. Позначення та назви для каналів є стандартними для всіх систем Dolby Surround:

L- Фронтальний лівий канал.
З- Центральний канал.
R- Передній правий канал.
S- surround-канал.
Lt- загальний лівий.
Rt- загальний правий

Принципова схемароботи кодера Dolby Surround

Як бачимо у процесі перетворення, сигнал центрального каналу ділиться порівну і мікшується з лівим і правим, у своїй його рівень знижується на 3 Дб. Сигнал S проходить обробку через окремий тракт, до складу якого входять:
bandpass-фільтр – обмеження частотної смуги в діапазоні 100 Гц – 7 Кгц (surround-канал має частотний діапазон 100 Гц – 7 КГц),
шумозаглушення Dolby B-type Noise Reduction,
коригування фази - складові сигналу S зсуваються по фазі таким чином, щоб при додаванні з лівим і правим каналом опинитися в протифазі.

У варіанті пасивного декодера сигнал S-каналу можна отримати простим відніманням Lt-Rt. На рис.2 представлена схема роботи найпростішого декодера Dolby Surround, на виході якого маємо L, R та S.

При декодуванні виникає кілька проблем, головна з яких - взаємопроникнення фронтальних каналів і S. Наприклад, при зміні рівноваги рівнів Lt і Rt сигнал S-каналу проникають складові і L, і R. Це питання вирішується двома шляхами - затримкою встановлюється на сигнал S, та обмеженням його частотного діапазону. При затримці, що дорівнює 10 мс, усувається ефект Хааса - сигнал з передніх каналів йде з випередженням і локалізація джерела асоціюється з ними. Обмеження звуку до 7КГц також дозволяє акцентувати увагу на фронтальних каналах, оскільки їхнє звучання яскравіше, ніж у S-каналів.

У такому варіанті пасивного декодування мається на увазі, що центральний канал є віртуальним і відповідає панорамному центру стереосистеми L і R. Дана система ідеалізована, оскільки гучномовці правого та лівого каналів повинні бути рівновіддалені від слухача, що на практиці практично недосяжно (у кінотеатрі багато слухачів).

Активні декодери Dolby Surround. Pro Logic

Активні декодери Dolby Surround – це нове покоління перетворювальних пристроїв від Dolby Labs, запроваджене в середині 80-х. Використовуючи як вихідні дані ті ж Lt і Rt, що і у варіанті пасивного декодера, вони передбачають складніший процес декодування з урахуванням наявності фізичкого (а не віртуального центрального каналу). Першим пристроєм такого класу став Dolby Prologic.

Декодер Dolby Pro Logic.

Умовно схему роботи Pro Logic можна поділити на дві складові – пасивну та активну. У пасивній частині сигнал S-каналу виходить простим відніманням сигналів лівого каналу з правого, а сигнал центрального каналу виходить шляхом складання правого та лівого. Як ми знаємо, при кодуванні S-канал записаний у протифазі і при такому додаванні він повинен зникнути. Щоб центральний канал був чутним, сигнали каналів L та R послаблюються на 3 Дб. Інший варіант – видалення сигналу центрального каналу з лівого та правого каналів. Робиться це також за допомогою протифазного складання та взаємної компенсації компонентів сигналів правого та лівого каналів. Цей принцип називається Cancellation Concept (принцип взаємної компенсації).

Якщо в процесі кодування та запису було змінено балансне співвідношення між Lt і Rt, то це може спричинити за собою ряд проблем - сигнал S-каналу проникають складові і L, і R, і так далі. У варіанті Pro Logic для вирівнювання балансу між вхідними Lt та Rt передбачено спеціальний модуль Level Control.

Активна частина цього декодера дозволяє виділяти звукові образи. Ця система призначена лише для кіно. Паралельно зі звуком іде відео. Відповідно основним завданням Pro Logic є забезпечення асоціативного ряду. В описі Pro Logic існує термін "домінуючий звуковий образ" (dominant sound). Поява цього терміна невипадково і має пряме відношення до психоакустики. При акцентуванні уваги глядача на домінуючому звуковому образі решта звукових об'єктів " розмазуються " у просторі і немає чіткої локалізації. У варіанті Dolby це називається Signal Masking Concept (прицип маскування сигналу). Саме він і є основним для систем активних декодерів. Відповідно, у цих пристроях сигнал промови є керуючим, решта - керовані. Якщо кіногерої говорять і паралельно з цим йде стереомузика, їх мова відтворюється центральним каналом, посилення L і R зменшується. Музика відтворюється за рахунок гучномовців S-каналу. При замовканні мови звукова картина та баланс рівнів каналів відновлюються та приходять у вихідний стан. Таким чином, ми отримуємо якесь "хитання", зване pumping.

Якщо персонажів кілька, їх мова відрізняється від інших звуків за потужністю, і вони локалізовані в різних місцях, то активний декодер Pro Logic працює в так званому "швидкому" режимі, перемикаючи налаштування з одного домінуючого образу на інший час реакції декодуючої системи мінімально. Якщо ж звуки немає значних розбіжностей за потужністю, то декодер перетворюється на " повільний " режим.

Адаптивна матриця Dolby Pro Logic.

Говорячи про системи Pro Logic, варто згадати важливий аспект, який їх вигідно відрізняє від попередників – декодер може визначати напрямок локалізацій звукових образів. Достатньо взяти амплітуду сигналу центрального каналу та порівняти її зі значеннями амплітуди цього ж сигналу у правому та лівому каналах, і ми можемо визначити вектор напряму локалізації звукового образу. Далі – справа техніки.

Серце Pro Logic – це адаптивна матриця. Для аналізу звукової картини використовується чотири вхідні сигнали - Lt, Rt, Lt+Rt і Lt-Rt, що подаються на два диференціальних підсилювача (на перший - Lt і Rt, на другий - Lt+Rt і Lt-Rt). В результаті на виходах цих підсилювачів виділяються два керуючі сигнали, що є нічим іншим як різницею логарифмів від амплітуд сигналів. Не дивлячись на те, що в результаті виходить всього два керуючі сигнали, вони є біполярними, що дозволяє зробити повний аналіз того, що відбувається. При цьому в даній матриці передбачено порівняння амплітуд з пороговими значеннями, що дозволяє перемикати "швидкий" та "повільний" режими.

На виході адаптивної матриці ми маємо блок аналізу, який оперує десятьма сигналами, складаючи та віднімаючи їх у певній ваговій пропорції. В результаті ми маємо чотири стандартні сигнали C, R, L і S.

Pro Logic II

Dolby Surround Pro Logic II – це наступний етап розвитку аналогових систем декодування та останній з них. Він набагато простіше за принципом роботи в порівнянні з Pro Logic, крім цього дозволяє робити прослуховування як surround не тільки звукових треків до кінофільмів, але і музичних записів Dolby Surround. Починаючи з цього етапу можна говорити про здешевлення стандартів Dolby, їх прихід на ринок побутових пристроїв.

Щоб зрозуміти простоту роботи Pro Logic II, розглянемо дві схеми. Перша – реалізація формування сигналу S-каналу.

Формування сигналу S-каналу

Як ми вже говорили в описі Pro Logic, дуже велике значення має відсутність проникнення сигналів L і R каналів в S-канал. Але, наприклад, якщо баланс між каналами змінено та домінуючий образ розташований у напрямку, наприклад, "центр-право", то таке проникнення буде обов'язковим. На рис. 5 показаний варіант найпростішого вирішення цієї проблеми. У ланцюзі між входами Lt і Rt і входом суматора ставляться два керовані підсилювачі VCA (Voltage Controlled Amplifier). Управління обома VCA взаємопов'язане у різній полярності. Якщо сигнал Lt потужніший за Rt, то посилення сигналу Lt перед суматором зменшується, а Rt, навпаки, збільшується. Таким чином, сигнали вирівнюються – проникнення мінімально.

Схема роботи: Pro Logic II.

Схема роботи Pro Logic II також є простою в розумінні. Сигнали з обох VCA надходять на модулі амплітудних детекторів FWR (Full-Wave Rectifier). Диференціальний підсилювач порівнює сигнали постійного струму, які пропорційні амплітудам сигналів Lt та Rt. Його сигнал є керуючим для VCA. Сигнал центрального каналу виходить шляхом складання вирівняних Lt і Rt.

Порівняно з Pro Logic, Pro Logic II немає "швидкого" і "повільного" режимів - змінна часу реагування змінюється постійно. Схема його роботи проста та зручна.

Dolby Digital AC-3

Dolby Digital AC-3або як його ще називають Dolby Digital 5.1 з'явився наприкінці 80-х і був розроблений для 35-мм плівки. З приходом цього стандарту на нас чекало кілька нововведень. По-перше, було розроблено шестиканальний стандарт, у якому з'явилася можливість використання сабвуфера, або як його ще називають LFE-channel (Low Frequency Effect). По-друге, S-канал перестав бути моно. Тобто, в системі 5.1 ми маємо в низку SL і SR-канали (Surround Left і Surround Right). Гучномовці всіх каналів, крім LFE, є широкосмуговими. Вперше стандарт запропонував можливості стиснення динамічного діапазону. При цьому стандарт АС-3 передбачає компресію даних. Зараз швидкість цифрового потоку аудіоданих Dolby Digital становить 320 кбіт/сек і більше.

Головна особливість Dolby Digital AC-3 – це його масштабованість.

Масштабування Dolby Surround 5.1.

Наприклад, ми написали музику у стандарті 5.1. При цьому користувач може її прослухати без втрат як 5.1 (5.0), чотириканальний варіант Pro Logic, у звичайному стерео і навіть в моно. І тепер уявіть як це вигідно і користувачам та виробникам. Комп'ютерні та відео-ігри нового покоління само собою мають на увазі наявність звуку 5.1. При цьому користувачі, які не мають розширених варіантів акустичних систем, не будуть почуватися дискомфортно - система масштабуватиметься під параметри системи, що є в наявності. Багато супутникових телеканалів ведуть мовлення в 5.1, але це ні як не відбивається на більшості глядачів, що мають телевізори з моно-звуком.

Налаштування багатоканальної системи

З цим фрагментом цього матеріалу ви могли зіткнутися у статті "Домашня студія на базі РС-2003. Hardware-рейтинг". Щоб зберегти цілісність розкриття теми, я дозволю собі деяке повторення. Причому воно дозволить сприйняти вам все найповніше.

На прикладі з Dolby Digital 5.1 ми можемо розглянути основні питання щодо встановлення акустичних систем та апаратного забезпечення для багатоканальних систем.

Правильне розміщення акустичних систем для Dolby 5.1

Dolby Surround 5.1 у розгорнутому вигляді для кінотеатрів та великих приміщень.

Як можна побачити з малюнка 8, система Dolby Digital 5.1 розрахована на основі ідеальних умов, де всі канали рівновіддалені від слухача. Але такі умови досить важко реалізувати фізично, особливо в умовах малих та великих приміщень із не ідеальною геометрією. Цю проблемуможна успішно розв'язати електричним шляхом. У рідній документації по відомості в Dolby Surround (www.dolby.com) наведено цікавий варіант розрахунків часів затримок – шляхом простого перекладуфутів у мілісекунди.

Якщо DimL – це відстань від слухача до лівого фронтального каналу у футах (30,48 см), а DimS – відстань від слухача до найближчого surround-каналу у футах, то затримка у цьому каналі має бути рівною різниці DimL та DimS. Іншими словами: Затримка (мілісекунди) = DimL (фути) – DimS (фути). Якщо лівий канал знаходиться від нас за 10 футів, а surround-- у п'яти, то параметр затримки дорівнює 5 мс (10-5=5).

Це справедливо не тільки для розрахунку взаємодій фронтальних і surround-каналів, але може застосовуватися і в інших випадках для вирівнювання картини. Наприклад, якщо центральний канал розташований ближче до слухача, ніж правий та лівий. Формула подібна:

Затримка (мілісекунди) = DimL (фути) – DimC (фути).
Відповідно, якщо ми оперуємо великою кількістю surround-каналів у великих приміщеннях, то параметри затримок кожної їх пари відбудовуються окремо.

2 відповіді

ТЛ: ін; це можливо; це може бути простіше, якщо ви програміст.

Оскільки закодована інформація є просто стереопарационную пару, немає гарантованого способу виявлення сигналу Dolby Pro Logic II (DPL2), якщо ви спеціально не зберігаєте власні метадані, що говорять "це файл DPL2". Але ви, мабуть, можете зробити досить гарне припущення.

Усі старі аналогові формати Dolby Surround, включаючи DPL2, зберігають інформацію об'ємного звучання у двох каналах, інвертуючи фазу об'ємного звучання або навколишнього звучання, а потім змішуючи їх із вихідними лівим та правим каналами. Декодери Dolby Surround, включаючи DPL2, намагаються відновити цю інформацію, інвертуючи фазу одного з двох каналів, а потім шукають схожості цих парах сигналів. Це або виконується тривіально, як Dolby Surround, або ці подібності штучно зміщені, щоб просуватися набагато далі вліво або вправо, або вліво або вправо, як в DPL2.

Отже, трюк полягає в тому, щоб визначити, чи важливі дані зберігаються в каналі (каналах) об'ємного звучання. Я намалюю вам метод, який може працювати, і я спробую висловити його без написання коду, але вам вирішувати, як реалізувати його і на свій смак.

Обрізати перші N секунд або близько вмісту програми в стереофайл, де N становить від одного до тридцяти. Виклик цього файлу.
Змішайте вхідні стереоканали з новим монофонічним файлом зі швидкістю -3 дБ на канал. Викличте цей файл Center.
Розділити лівий та правий канали введення в окремі файли. Назвіть ці ліві та праві.
Інвертувати правий канал. Викличте цей файл RightInvert.
Змішайте канали Left та RightInvert з новим монофонічним файлом зі швидкістю -3 дБ на канал. Викличте файл Surround.
Визначте RMS та пік дБ файлу Surround.
Якщо RMS або пікова БД файлу Surround нижче за "допуск", зупиніть; вихідний файл або монофонічний, або централізований, і, отже, немає інформації об'ємного звучання. Вам потрібно поекспериментувати з кількома джерелами DPL2 і без DPL2, щоб дізнатися, що таке допуски, але після дюжини або близько файлів цифри повинні стати ясними. Я припускаю близько –30 дБ або близько того.
Інвертируйте файл Center у новий файл. Викличте цей файл CenterInvert.
Змішайте файл CenterInvert у файл Surround з 0 дБ (як CenterInvert, так і Surround мають бути моно). Викличте новий файл SurroundInvert.
Визначте RMS та пік dB файлу SurroundInvert.
Якщо RMS та/або пік dB SurroundInvert нижче "допуск", зупинка; Ваше вихідне джерело містить загорану ліву або праву передню інформацію, а не інформацію про навколишній простір. Вам потрібно буде поекспериментувати з декількома джерелами DPL2 і не DPL2, щоб дізнатися, що таке допуски, але після дюжини або близько файлів цифри повинні стати ясними - я припускаю близько -35 дБ або близько того.
Якщо ви дійшли до цього, ваш вихідний вхід, ймовірно, містить інформацію про навколишній простір і, отже, ймовірно, є членом сімейства кодувань Dolby Surround.

Я написав цей алгоритм таким чином, що ви можете виконати кожен із цих кроків за допомогою спеціальної командив. Якщо ви хочете бути більш люб'язним замість виконання кроку RMS/пікового значення в sox, ви можете запустити програму і перевірити свої рівні в LUFS проти допусків. Якщо ви хочете бути ще більш привабливим, створивши файли Surround та Center, ви можете відфільтрувати всі частоти вище 7 кГц і зробити акцент на них, як реальний декодер DPL2.

Щоб цей алгоритм був простий, я накидав його повністю у сфері амплітуди. Розрахунок файлу SurroundLevel, ймовірно, буде набагато більш точно виконаним у частотній області, якщо ви знаєте, як обчислити величину та кут біт FFT, і ви використовуєте вікна від 30 до 100 мс. Але ця версія cheapo вище має вас почати.

Остання застереження. AAC – це сучасний психоакустичний кодек, що означає, що йому подобається грати в ігри зі стереофазуванням та візуалізацією для досягнення стиснення. Тому я вважаю ймовірним, що простий акт інкапсуляції DPL2 у потік AAC, швидше за все, вкладе деякі із зображень, присутніх у DPL2. Щоб бути відвертим, ні DPL2, ні AAC не належать ніде у цьому конвеєрі. Якщо потрібно зберегти аналоговий потік, спочатку закодований за допомогою DPL2, зробіть це у форматі без втрат, такому як WAV або FLAC, а не AAC.

На момент написання цієї статті операційна концепція Dolby Pro Logic (I) була . Ці базові концепції, як і раніше, застосовуються до DPL2; операційні концепції для DPL2.

Якщо файл має більше одного каналу, ви можете певною мірою припустити, що вони використовуються для цілей об'ємного звучання, хоча вони можуть бути просто кількома доріжками. У цьому випадку він падає на ігрову систему, щоб робити з каналами, оскільки вона "думає" найкраще. (якщо заголовок файлу не каже, що робити)

Але файл є стерео. Якщо ви хочете дізнатися, чи це віртуальний файл об'ємного звучання, ви можете подивитися в заголовку поля кодера, щоб дізнатися, який кодер був використаний. Це може трохи допомогти, хоч і не дуже. В основному поле кодера залишається порожнім, а по-друге, кодер не повинен бути таким же, як рекодер, який змішує дані об'ємного звучання. Тобто, рекодер спочатку створить необроблені дані PCM, а потім подасть його на деякий кодер для створення стисненого файлу. (AAC або щось інше) Крім того, існує безліч програм та версій, які можуть змінюватися, тому поле кодера може відслідковувати все, що було б неприємно.

Однак ви можете з упевненістю більш ніж на 60% вивести щось віртуальне оточення чи ні, вивчаючи дані. Це буде вдосконалений DSP і для швидкості може бути задіяне навіть машинне навчання. Вам потрібно буде з'ясувати, чи стереосигнали містять певні функції HRTF (функція передачі, пов'язана з головкою). Це може бути досягнуто шляхом вивчення відмінностей інтенсивності та затримок між тим самим звуком, що з'являється у часовій області та гармонійними характеристиками (характерні зміни частоти) у частотній області. Вам потрібно буде зробити те й інше, тому що один без іншого може просто сказати вам, що щось дуже хороший стереозапис, а не віртуальне оточення. Я не знаю, чи є якісь функції HRTF, які вже були зіставлені, чи вам потрібно буде зробити це самостійно.

Це дуже складне рішення, що вимагає багато часу зробити правильно. Також продуктивність буде проблематичною.

За допомогою цього методу ви також можете відключити стерео мікшування майже до оригінальних каналів об'ємного звучання. Але для перетворення стерео в навколишній простір використовуються інші методи і вони звучать добре.

Якщо ви налаштовані виконати таке виявлення, присвятіть півроку або тяжкі роботи, якщо немає функцій HRTF, кілька тижнів, якщо вони є, приготуйтеся до великого стресу, і я бажаю вам удачі. Я зробив щось подібне. Це вбивця.

Якщо ви хочете використати готове рішеннятоді відповідь на ваше запитання не буде, якщо тільки заголовок не надасть вам поле енкодера, а кодувальник відрізняється і, як відомо, використовується тільки для перетворення об'ємного звуку в стерео. Я не думаю, що хтось зробив це з фактичних даних, як я описав, або якщо вони це зробили це частина комерційного продукту. Виконання того, що вам потрібно зазвичай не потрібно, але це можна зробити.

Ow, BTW, спробуйте інверсію HRTF у googling, це може дати деяку допомогу.

Pro Logic II – активний декодер Dolby Surround наступного покоління. Він також використовує просторове фокусування, але реалізований принципово іншими способами. Новий декодер вийшов набагато простішим і при цьому ефективнішим.

Згадаймо: завдання декодера - запобігти проникненню сигналів L і R канал S, незалежно від того, де знаходиться джерело сигналу - точно між мікрофонами L і R, зміщений від центру в ту чи іншу сторону або взагалі знаходиться безпосередньо поруч з мікрофоном одного з каналів. Наприклад, якщо герої ведуть діалог між мікрофонами каналів R і C (право від центру), рівень сигналу в каналах C і R буде однаковим. У цьому випадку частина сигналу неминуче проникне на вихід S пасивного декодера, так як рівень у каналі L нижче, ніж у каналі R, і при відніманні одного сигналу з іншого результат не буде нульовим.

Щоб повністю компенсувати сигнали L і R на входах декодера surround, перед подачею на суматор необхідно вирівняти їх рівні. Для цього між входами Lt і Rt і входами суматора встановлюються два регульовані підсилювачі (VCA). Посилення VCA двох каналів змінюється тим самим управляючим сигналом, але у різної полярності. Якщо посилюється один VCA, посилення другого зменшується. Якщо таке регулювання здійснювати досить точно і синхронно зі змінами самого сигналу, можна повністю придушити різницевий сигнал каналів Lt і Rt в каналі Surround.

Щоб автоматично відстежити зміни вхідних сигналів, використовується спеціальний ланцюг негативного зворотного зв'язку (feedback servo circuit). Вихідні сигнали обох VCA надходять на амплітудні детектори (Full-Wave Rectifier, FWR), які виділяють огинає звукових сигналів. Сигнали постійного струму, пропорційні амплітуди сигналів L і R, порівнюються диференціальним підсилювачем. Сигнал з виходу підсилювача, пропорційний різниці амплітуд, використовується для управління VCA. На рисунку 11 показана тільки одна вісь декодера (вісь "лівий-правий"). Друга пара VCA з таким же керуючим ланцюгом вирівнює рівні сигналів суми L+R (фронтальний) і різниці L-R (тиловий) для придушення сигналів С і S в каналах R і L (вісь "центр - surround"). Сигнал центрального каналу виходить складанням (замість віднімання) двох сигналів Lt і Rt, вирівняних за рівнем підсилювачами VCA. Завдяки використанню керуючих ланцюгів з зворотними зв'язками, декодер Pro Logic II набув таких переваг:

Простими і дешевими апаратними засобами досягається ефективніша компенсація протифазних сигналів у вихідний матриці, і, як результат, високий рівень розв'язки між каналами різних осей.

У декодері Pro Logic обидві осі контролюються єдиним перемикаючим ланцюгом "швидко/повільно". Якщо хоча б по одній осі існує значне домінування, перемикаючий ланцюг переводить обидві осі в "швидкий" режим, примусово змінюючи постійну часу керуючих ланцюгів VCA. Тільки за умови, що в обох осях амплітуди сигналів приблизно однакові, вони переходять в "повільний" режим. У декодері Pro Logic II дві осі функціонують незалежно одна від одної, тому їх керуючі ланцюги самі вирішують, наскільки швидко необхідно змінювати посилення VCA, аналізуючи лише власні сигнали. Крім того, постійна часу керуючого ланцюга в декодерах Pro Logic II змінюється безперервно, тоді як у Pro Logic передбачено лише два фіксовані значення.

Планшети