Усі сучасні мікросхеми цифро-аналогових перетворювачів для аудіо мають у своєму складі мультибітові Сігма-Дельта Модулятори з мультирівневим ЦАП й тим чи іншим різновидом DEM між цими блоками (повністю структура виглядає як ЦФ-СДМ-ДЕМ-ЦАП).
Модулятори бувають різних порядків, чим вищий порядок модулятора - тим менший шум у звуковій смузі і тим він більший за її межами.
Перевагою мультибітних модуляторів є більше відношення сигнал/шум при тій же частоті і порядку модулятора ніж у 1-бітових СДМ (5-бітовий СДМ в однакових умовах буде мати на 30 дБ краще відношення с/ш ніж однобітовий у смузі до Fmod/2).
Недоліками є шум, що залежить від рівня сигналу, і в першу чергу лінійність, оскільки розкид параметрів генераторів стабільного струму або резисторів або конденсаторів (залежно від типу ЦАП) в кілька відсотків призводить до суттєвих спотворень для боротьби з якими придумали блок динамічного підбору елементів (DEM).
DEM усереднює нелінійність мультирівневого цапа, але час усереднення обернено пропорційний частоті роботи модулятора і прямо пропорційний розрядності ЦАП, тобто чим вище розрядність вашого цап і чим нижча частота роботи модулятора тим більше часу треба для усереднення нелінійності. Різновид DEM першого порядку (що стоїть у 90% мультирівневих ЦАПів наприклад AK4399, AD1955, PCM1792, ES9018) не дуже добре усереднює нелінійність і має сильну залежність якості усереднення від рівня сигналу, і як будь-який СДМ 1го порядку дуже гадить паттернами(idle tones) як біля Fmod/2 так і такими, що напряму потрапляють у ЗЧ область.
Тому цифри спотворень виміряні на синусі для таких ЦАП немають нічого спільного з лінійністю на реальних музичних сигналах, але гарні цифри спотворень разом із гарними цифрами відношення с/ш дають змогу добре рекламувати й продавати продукцію.
Окремо можна відмітити WM8741/8742, в них було застосовано специфічний DEM 2го порядку (паттернів від нього немає навіть на Fmod/2!), ЦАП виконано не на однакових елементах, а зваженій матриці 1-2-4-8, що разом з частотою роботи модулятора у 256fs дало змогу зменшити час усереднення порівняно з конкурентами (6біт 64-128xб як от AK4399, PCM179x, AD1955 і т.д.) у 10-20 разів. (Але природньо через те, що застосовано матрицю 1-2-4-8, коефіцієнт гармонік на синусі вже не буде таким гарним як у цапах з однаковими елементами).
Також вони зробили модулятор малого порядку та якісно "заапсемплили" вхідний потік до частоти роботи модулятора. Але 8741/8742 через особливості/косяк дайки дико геморойна в застосуванні, що робить її використання в DIY розробках повністю неможливим.
Власне ЦАП в сучасних мікросхемах буває двох різновидів - неперервного часу (на виході неперервно струм або напруга) та дискретного часу (дискретно зарядом, різновиди Switched Capacitor, в основному застосовуються Direct Charge Transfer структури).
Перевагами ЦАП дискретного часу (SC dac) є фільтрація на переході з цифрового домену в аналоговий, що дає змогу зменшити чутливість до "білого" джиттеру й зменшити шум вище звукового діапазону. Недоліками є підвищене споживання струму живлення через наявність операційних підсилювачів(ОП) обов'язкових для такої структури, і, що дійсно для нас важливо - наявність динамічних спотворень через те що ОП завжди перебуває в режимі обмеження за швидкістю зміни напруги (slew rate limiting) і кодозалежному часі встановлення (settling time).
1-бітові СДМ і ЦАП:
Недоліками є менше (але кодонезалежне) відношення с/ш за тої ж частоти та порядку модулятора ніж у мультибітових СДМ, складність у дизерингу СДМ, менший досяжний коефіцієнт модуляції, потужні патерни(idle tones) в області Fmod/2 при малих вхідних сигналах (без сигналу й без дизерингу на виході потік то 010101 ... 0101), збільшення позасмугового шуму при зменшенні аудіо сигналу (потужність 1-бітового потоку завжди незмінна, перерозподіляється тільки спектр, якщо аудіо сигнал великий то ВЧ шум зменшується та навпаки).
Переваги, звичайно ж, такі: гарна (в ідеалі абсолютна) лінійність, що на синусі, що на аудіо сигналі однакова, менший струм споживання й займана на кристалі площа (через відсутність DEM і у 2^N меншого ЦАП).
Власне ЦАП може бути дискретного часу або неперервного часу, але також можливий ще один тип - FIRDAC.
FIRDAC or Semidigital FIR:
FIRDAC неперервного часу для 1-бітових СДМ вперше запропонували Девід Су і Брюс Вулі в 1993 році.
Він являє собою реалізацію FIR фільтра цифровим та аналоговим методом одночасно, затримка реалізована цифровим методом, а коефіцієнти фільтра та суматор аналоговим. Коефіцієнти фільтра задаються струмом, а суматором виступає каскад перетворення струм-напруга (I/U).
АЧХ однієї з можливих реалізацій такого ЦАП для аудіо застосувань показано нижче (128tap)
Вихідний сигнал такого фільтра/цапа є еквівалентним мультирівневому ЦАП з дуже великою кількістю рівнів (розрядністю) але не має його недоліків, неточність струмів у цьому випадку призводить до зміни АФЧХ фільтра, а не до нелінійних спотворень як у мультирівневих ЦАП.
Перевагами FIRDAC неперервного часу є лінійність, при достатній довжині відмінне придушення позасмугових перешкод (відмінний "аналоговий" сигнал на його виході), дуже маленька чутливість до джиттеру, дуже невеликі вимоги до швидкодії(менш як 1 В/мкс) та смуги операційного підсилювача каскаду перетворення струм-напруга й відповідно відсутність динамічних спотворень.
Недоліками є велика займана площа кристала, потрібен дрібний техпроцес.
Синус 20 кГц 0 дБ при ЧД 44,1 кГц на виході ~75 tap FIRDAC (без будь-якої фільтрації у смузі до 400 МГц).
Розрядність, частота дискретизації, шум і хайрез:
Деякі люди вважають, що, щоб повноцінно слухати цифрові фонограми високої роздільної здатності необхідно мати великий динамічний діапазон(>120 дБ) і високу частоту дискретизації. Але насправді все трішки не так.
Рівень шуму на студії звукозапису становить 25-30 дБ, максимальне SPL класичних музичних інструментів за пару метрів від них не перевищує 110 дБ, тому максимально досяжний динамічний діапазон (ДД) некомпресованого запису (яких практично не буває) становить 80-85 дБ, що відповідає розрядності всього в 14 біт. Аналізуючи багато записів можна переконатися, що лише дуже мало з них мають реальне відношення с/ш в 80-85 дБ, здебільшого дуже добре якщо є 70-75 дБ с/ш. У домашніх умовах рівень фонового шуму більший, а максимальний SPL у АС рідко досягає 110 дБ за кілька метрів від них, тому ДД ще менше.
Висока частота дискретизації гарна тим, що на етапах аналого-цифрового та цифро-аналогового перетворення можна застосувати ЦФ з плавним спадом АЧХ щоб уникнути застосування brickwall ЦФ і пов'язаних з його застосуванням проблем у звуці.
Але на жаль записи з ЧД 96/192 кГц переважно робляться із застосуванням brickwall ЦФ і відповідно не дають майже ніяких переваг над 44.1, єдине, оскільки хайрез позиціонується як кращий формат, то сам запис, зведення й мастеринг часто виконуються на хорошому рівні, що дає змогу людям, які не дуже розуміються у цих питаннях говорити про однозначну перевагу хайреза нібито саме через високу розрядність і ЧД. Окремо варто згадати DSD, тут цих всіх проблем немає але є інші, проте якщо використовувати цей фільтр http://s-audio.systems/catalog/dsd-filter то можна отримати лише переваги DSD при використанні 1-бітових ЦАП.
Дещо про аліаси:
Для УМЗЧ з негативним зворотнім зв'язком найгіршими є перешкоди та шуми в області його частоти одиничного підсилення, яка у більшості підсилювачів лежить в області 0,5...1,5 МГц, тому аліаси та шуми (у випадку СДМ) на цих частотах повинні розташовуватись нижче -80..90 дБ. А це означає (враховуючи додаткове придушення sin(x)/x і використання ЦФ 2х..8х) що якщо не використовувати ФНЧ з апроксимацією Чебишева і Баттерворта, і не робити частоту зрізу занадто низькою (нижче 60 кГц вже занадто помітно), це виливається у використання ФНЧ мінімум 4 порядку. Для СДМ ще треба враховувати, що мінімально допустимий порядок ФНЧ повинен дорівнювати порядку модулятора для ефективного придушення позасмугових шумів.
Дещо про джиттер:
Джиттер - це нестабільність тактового сигналу. Представити(і поміряти) його можна у часовій області як нестабільність часу фронтів/спадів щодо їх ідеальних значень(TIE/period/cycle to cycle jitter) або в спектральній області як графік шуму на різних частотах відносно несучої (phase jitter). Вимірювання (якщо їх виконано коректно) в обох областях дають ідентичний результат, але вимірювання в частотній області є простішим, ніж у часовій, тому що наприклад щоб виміряти джиттер від 1 Гц і вище треба осцилограф який має крім великої частоти дискретизації ще й велику пам'ять щоб оцифрувати відразу 1сек з великою частотою дискретизації (4..20 Ггц)(розгортка в осцилографі діє як ФВЧ).
Джиттер впливає на вихідний сигнал ЦАП як збільшення шуму (якщо джиттер без спурів) або додається + модуляція сигналу іншими частотами(якщо фазноїс зі спурами).
Допустимим є такий рівень джиттеру (без спурів!) при якому не зменшується відношення с/ш ЦАП нижче відношення с/ш записів, а це як було сказано вище ~80 дБ с/ш. А це для більшості типів СДМ мс ЦАП виливається в інтегральне значення джиттеру в кілька одиниць і навіть десятків наносекунд. Найбільш жорстким критерієм може бути такий рівень джиттеру, при якому не погіршується відношення с/ш конкретної мікросхеми ЦАП, наприклад для PCM1792 щоб отримати с/ш в 120 дБ інтегральне значення джиттеру має бути не більше 300пс.
Але якщо джиттер зі спурами, то тут з'являється сильна залежність інтегрального значення джиттеру від типу ЦАП і від частоти спурів, але загалом у цьому випадку можна говорити про достатність інтегрального значення джиттеру для більшості типів СДМ мс ЦАП(крім фактично 1-бітників неперервного часу) в кілька десятків-сотню пікосекунд.
Дещо про слух:
Людське вухо фізично може розрізняти близько 500 частот, і близько 24 частотні області при шумоподібному сигналі. Одночасний динамічний діапазон слуху 90дб. Так, наш перетворювач акустичних сигналів в електричні зовсім "слабенький" якщо порівнювати з зором, але тут на допомогу йому приходить "сигнальний процесор" в нашому мозку. Через це маємо дві речі, ми можемо тренувати "слух"(тобто мозок) краще розрізняти азимут, спотворення і тому подібні речі, і нажаль те, що не тренований "слух" легко надурити. Наш мозок добре розрізняє відносні зміни, але не абсолютні.
Модулятори бувають різних порядків, чим вищий порядок модулятора - тим менший шум у звуковій смузі і тим він більший за її межами.
Перевагою мультибітних модуляторів є більше відношення сигнал/шум при тій же частоті і порядку модулятора ніж у 1-бітових СДМ (5-бітовий СДМ в однакових умовах буде мати на 30 дБ краще відношення с/ш ніж однобітовий у смузі до Fmod/2).
Недоліками є шум, що залежить від рівня сигналу, і в першу чергу лінійність, оскільки розкид параметрів генераторів стабільного струму або резисторів або конденсаторів (залежно від типу ЦАП) в кілька відсотків призводить до суттєвих спотворень для боротьби з якими придумали блок динамічного підбору елементів (DEM).
DEM усереднює нелінійність мультирівневого цапа, але час усереднення обернено пропорційний частоті роботи модулятора і прямо пропорційний розрядності ЦАП, тобто чим вище розрядність вашого цап і чим нижча частота роботи модулятора тим більше часу треба для усереднення нелінійності. Різновид DEM першого порядку (що стоїть у 90% мультирівневих ЦАПів наприклад AK4399, AD1955, PCM1792, ES9018) не дуже добре усереднює нелінійність і має сильну залежність якості усереднення від рівня сигналу, і як будь-який СДМ 1го порядку дуже гадить паттернами(idle tones) як біля Fmod/2 так і такими, що напряму потрапляють у ЗЧ область.
Тому цифри спотворень виміряні на синусі для таких ЦАП немають нічого спільного з лінійністю на реальних музичних сигналах, але гарні цифри спотворень разом із гарними цифрами відношення с/ш дають змогу добре рекламувати й продавати продукцію.
Окремо можна відмітити WM8741/8742, в них було застосовано специфічний DEM 2го порядку (паттернів від нього немає навіть на Fmod/2!), ЦАП виконано не на однакових елементах, а зваженій матриці 1-2-4-8, що разом з частотою роботи модулятора у 256fs дало змогу зменшити час усереднення порівняно з конкурентами (6біт 64-128xб як от AK4399, PCM179x, AD1955 і т.д.) у 10-20 разів. (Але природньо через те, що застосовано матрицю 1-2-4-8, коефіцієнт гармонік на синусі вже не буде таким гарним як у цапах з однаковими елементами).
Також вони зробили модулятор малого порядку та якісно "заапсемплили" вхідний потік до частоти роботи модулятора. Але 8741/8742 через особливості/косяк дайки дико геморойна в застосуванні, що робить її використання в DIY розробках повністю неможливим.
Власне ЦАП в сучасних мікросхемах буває двох різновидів - неперервного часу (на виході неперервно струм або напруга) та дискретного часу (дискретно зарядом, різновиди Switched Capacitor, в основному застосовуються Direct Charge Transfer структури).
Перевагами ЦАП дискретного часу (SC dac) є фільтрація на переході з цифрового домену в аналоговий, що дає змогу зменшити чутливість до "білого" джиттеру й зменшити шум вище звукового діапазону. Недоліками є підвищене споживання струму живлення через наявність операційних підсилювачів(ОП) обов'язкових для такої структури, і, що дійсно для нас важливо - наявність динамічних спотворень через те що ОП завжди перебуває в режимі обмеження за швидкістю зміни напруги (slew rate limiting) і кодозалежному часі встановлення (settling time).
1-бітові СДМ і ЦАП:
Недоліками є менше (але кодонезалежне) відношення с/ш за тої ж частоти та порядку модулятора ніж у мультибітових СДМ, складність у дизерингу СДМ, менший досяжний коефіцієнт модуляції, потужні патерни(idle tones) в області Fmod/2 при малих вхідних сигналах (без сигналу й без дизерингу на виході потік то 010101 ... 0101), збільшення позасмугового шуму при зменшенні аудіо сигналу (потужність 1-бітового потоку завжди незмінна, перерозподіляється тільки спектр, якщо аудіо сигнал великий то ВЧ шум зменшується та навпаки).
Переваги, звичайно ж, такі: гарна (в ідеалі абсолютна) лінійність, що на синусі, що на аудіо сигналі однакова, менший струм споживання й займана на кристалі площа (через відсутність DEM і у 2^N меншого ЦАП).
Власне ЦАП може бути дискретного часу або неперервного часу, але також можливий ще один тип - FIRDAC.
FIRDAC or Semidigital FIR:
FIRDAC неперервного часу для 1-бітових СДМ вперше запропонували Девід Су і Брюс Вулі в 1993 році.
Він являє собою реалізацію FIR фільтра цифровим та аналоговим методом одночасно, затримка реалізована цифровим методом, а коефіцієнти фільтра та суматор аналоговим. Коефіцієнти фільтра задаються струмом, а суматором виступає каскад перетворення струм-напруга (I/U).
АЧХ однієї з можливих реалізацій такого ЦАП для аудіо застосувань показано нижче (128tap)
Вихідний сигнал такого фільтра/цапа є еквівалентним мультирівневому ЦАП з дуже великою кількістю рівнів (розрядністю) але не має його недоліків, неточність струмів у цьому випадку призводить до зміни АФЧХ фільтра, а не до нелінійних спотворень як у мультирівневих ЦАП.
Перевагами FIRDAC неперервного часу є лінійність, при достатній довжині відмінне придушення позасмугових перешкод (відмінний "аналоговий" сигнал на його виході), дуже маленька чутливість до джиттеру, дуже невеликі вимоги до швидкодії(менш як 1 В/мкс) та смуги операційного підсилювача каскаду перетворення струм-напруга й відповідно відсутність динамічних спотворень.
Недоліками є велика займана площа кристала, потрібен дрібний техпроцес.
Синус 20 кГц 0 дБ при ЧД 44,1 кГц на виході ~75 tap FIRDAC (без будь-якої фільтрації у смузі до 400 МГц).
Розрядність, частота дискретизації, шум і хайрез:
Деякі люди вважають, що, щоб повноцінно слухати цифрові фонограми високої роздільної здатності необхідно мати великий динамічний діапазон(>120 дБ) і високу частоту дискретизації. Але насправді все трішки не так.
Рівень шуму на студії звукозапису становить 25-30 дБ, максимальне SPL класичних музичних інструментів за пару метрів від них не перевищує 110 дБ, тому максимально досяжний динамічний діапазон (ДД) некомпресованого запису (яких практично не буває) становить 80-85 дБ, що відповідає розрядності всього в 14 біт. Аналізуючи багато записів можна переконатися, що лише дуже мало з них мають реальне відношення с/ш в 80-85 дБ, здебільшого дуже добре якщо є 70-75 дБ с/ш. У домашніх умовах рівень фонового шуму більший, а максимальний SPL у АС рідко досягає 110 дБ за кілька метрів від них, тому ДД ще менше.
Висока частота дискретизації гарна тим, що на етапах аналого-цифрового та цифро-аналогового перетворення можна застосувати ЦФ з плавним спадом АЧХ щоб уникнути застосування brickwall ЦФ і пов'язаних з його застосуванням проблем у звуці.
Але на жаль записи з ЧД 96/192 кГц переважно робляться із застосуванням brickwall ЦФ і відповідно не дають майже ніяких переваг над 44.1, єдине, оскільки хайрез позиціонується як кращий формат, то сам запис, зведення й мастеринг часто виконуються на хорошому рівні, що дає змогу людям, які не дуже розуміються у цих питаннях говорити про однозначну перевагу хайреза нібито саме через високу розрядність і ЧД. Окремо варто згадати DSD, тут цих всіх проблем немає але є інші, проте якщо використовувати цей фільтр http://s-audio.systems/catalog/dsd-filter то можна отримати лише переваги DSD при використанні 1-бітових ЦАП.
Дещо про аліаси:
Для УМЗЧ з негативним зворотнім зв'язком найгіршими є перешкоди та шуми в області його частоти одиничного підсилення, яка у більшості підсилювачів лежить в області 0,5...1,5 МГц, тому аліаси та шуми (у випадку СДМ) на цих частотах повинні розташовуватись нижче -80..90 дБ. А це означає (враховуючи додаткове придушення sin(x)/x і використання ЦФ 2х..8х) що якщо не використовувати ФНЧ з апроксимацією Чебишева і Баттерворта, і не робити частоту зрізу занадто низькою (нижче 60 кГц вже занадто помітно), це виливається у використання ФНЧ мінімум 4 порядку. Для СДМ ще треба враховувати, що мінімально допустимий порядок ФНЧ повинен дорівнювати порядку модулятора для ефективного придушення позасмугових шумів.
Дещо про джиттер:
Джиттер - це нестабільність тактового сигналу. Представити(і поміряти) його можна у часовій області як нестабільність часу фронтів/спадів щодо їх ідеальних значень(TIE/period/cycle to cycle jitter) або в спектральній області як графік шуму на різних частотах відносно несучої (phase jitter). Вимірювання (якщо їх виконано коректно) в обох областях дають ідентичний результат, але вимірювання в частотній області є простішим, ніж у часовій, тому що наприклад щоб виміряти джиттер від 1 Гц і вище треба осцилограф який має крім великої частоти дискретизації ще й велику пам'ять щоб оцифрувати відразу 1сек з великою частотою дискретизації (4..20 Ггц)(розгортка в осцилографі діє як ФВЧ).
Джиттер впливає на вихідний сигнал ЦАП як збільшення шуму (якщо джиттер без спурів) або додається + модуляція сигналу іншими частотами(якщо фазноїс зі спурами).
Допустимим є такий рівень джиттеру (без спурів!) при якому не зменшується відношення с/ш ЦАП нижче відношення с/ш записів, а це як було сказано вище ~80 дБ с/ш. А це для більшості типів СДМ мс ЦАП виливається в інтегральне значення джиттеру в кілька одиниць і навіть десятків наносекунд. Найбільш жорстким критерієм може бути такий рівень джиттеру, при якому не погіршується відношення с/ш конкретної мікросхеми ЦАП, наприклад для PCM1792 щоб отримати с/ш в 120 дБ інтегральне значення джиттеру має бути не більше 300пс.
Але якщо джиттер зі спурами, то тут з'являється сильна залежність інтегрального значення джиттеру від типу ЦАП і від частоти спурів, але загалом у цьому випадку можна говорити про достатність інтегрального значення джиттеру для більшості типів СДМ мс ЦАП(крім фактично 1-бітників неперервного часу) в кілька десятків-сотню пікосекунд.
Дещо про слух:
Людське вухо фізично може розрізняти близько 500 частот, і близько 24 частотні області при шумоподібному сигналі. Одночасний динамічний діапазон слуху 90дб. Так, наш перетворювач акустичних сигналів в електричні зовсім "слабенький" якщо порівнювати з зором, але тут на допомогу йому приходить "сигнальний процесор" в нашому мозку. Через це маємо дві речі, ми можемо тренувати "слух"(тобто мозок) краще розрізняти азимут, спотворення і тому подібні речі, і нажаль те, що не тренований "слух" легко надурити. Наш мозок добре розрізняє відносні зміни, але не абсолютні.
"The universal aptitude for ineptitude makes any human accomplishment an incredible miracle." John Stapp