Osa1 Osa2 Osa3 Osa4 Osa5 OsaX  

Jussi Honka
jussi.honka(a)werk23.org
http://sound.werk23.org

Äänen jälkikäsittelyn tekniikkaa
 
Kanavat ja kaiuttimet
Laitteet ja ohjelmistot
Efektit ja prosessorit
DVD:n ääniformaatit
 
Lataa kaikki osat PDF:nä

DVD-V ja AUDIO

DVD-V (video) levylle, eli normaalille "elokuva-DVD:lle", voi yhden videon ääniraidoiksi laittaa joko Dolby Digitalia ja kaksi raitaa MPEG-pakattua ääntä tai kaksi raitaa PCM:ää (joka on siis "normaali" wav tai aiff -tiedosto). DVD:n siirtonopeus on 10.1 mbps kuvalle ja äänelle yhteensä. Dolby Digital 5.1 -surroundina käyttää siitä 448 kbps, PCM stereo (16 bit, 48 kHz) vie 1.5 mpbs. DTS käyttää samaa "streamia" PCM:n kanssa, sen kaistantarve yleensä 1.4 mbps. Kuvan koosta riippuu, miten paljon kaistaa jää äänelle ja mitä ääniformaatteja on mahdollista käyttää.

MATRISOIDUN SURROUNDIN HISTORIAA

1976 Dolby Stereo - Filmille laitettava optinen stereoääni, josta matriisilla erotettiin L, C, R, S.

1982 Dolby Surround - "Dolby Stereo kotiin". Kanavat L, R ,S.

1987 Dolby Pro Logic - Dolby Surroundin parannettu versio, johon lisätty keskikanava, L, C, R, S. Myös kanavien erottelua parannettu

2000 Dolby Pro Logic II - Dolby PL:n parannettu versio, simuloi 5.1 formaattia. Kanavat ovat L, C, R, Ls, Rs, Lfe

2003 Dolby Pro Logic IIx - PL2:n parannettu versio, simuloi 6.1 ja 7.1 formaatteja. Kanavat L, C, R, Ls, Rs, LR (left rear), RR (right rear), LFE. Tekee 5.1 äänestä 7.1 äänen lisäämällä LR ja RR -kanavat.

Myös DTS:llä matriisoituja systeemejä: DTS Neo:6 Cinema/Music (stereosta matrisoidaan L, C, R, Ls, Rs, Cs) ja THX Ultra2 Cinema/Music/Game (matrisoidaan L, C, R, Ls, Rs, Lr, Rr, Lfe)

 

Tämä kappale on osittain kopio Findie ry:lle tekemästäni "Monikanavaääni ABC" -artikkelista. Koko artikkeli on luettavissa heidän sivuiltaan tai PDF:nä tästä.

MONIKANAVAFORMAATIT

Kuluttajaformaatteja on kolme:

a) Dolby Surround (nykyisin Dolby Surround Pro Logic 1 tai 2) (analoginen)

b) Dolby Digital (digitaalinen, pakattu)

c) DTS (digitaalinen, pakattu)

Näiden lisäksi on olemassa elokuvateatteriin erilaisia formaatteja, mm. SDDS. Niistä ei sen enempää. Mainittakoon kuitenkin, että SDDS on 7.1 formaatti, jossa etukanavia on viisi ja formaatti on tarkoitettu todella isoille kankaille (esim. 20x30m).

Dolby Surround Pro Logic

Dolby Surround Pro Logic on analoginen järjestelmä, joka tuottaa matriisin avulla stereoäänestä nelikanavaisen version. Stereosta erotetaan L, C ja R sekä yksi surroundkanava. Mikä tahansa stereoäänite on purettavissa Dolby Surroundiksi, mutta jollei äänitettä ole miksattu dekooderin läpi, ei lopputulos välttämättä ole halutunlainen

- Samassa vaiheessa oleva tulee keskikaiuttimesta
- Eri vaiheessa oleva LR
- Taakse lähtee vastakkaisvaiheiset vasemman ja oikean kanavan signaalit viiveellä ja taajuuskaista rajoitetaan alueelle 200 - 7000 Hz.

Pro Logic on dekooderin nimi ja PL2 on siitä kehittyneempi versio, jossa takakanavat ovat stereona ja muitakin ominaisuuksia lisätty. Alunperin nimitys Dolby Surround oli kuluttajaversio elokuvateatterin Dolby Stereosta ja se oli kolmekanavainen (LRS). Dolby Surround -matrisoitua stereoversiota kutsutaan usein nimelle LtRt (Left total, Right total). En tässä käsittely Pro Logicin ominaisuuksia sen enempää. DVD:lle Dolby Surroundin voi laittaa AC-3, DTS, MPEG tai PCM -tiedostona.

Dolby Digital, DD

Dolby Digital on diskreetti digitaalinen ääniformaatti. Toisin kuin Dolby Surroundissa, DD:ssä kanavat ohjataan tarkasti oikeaan kaiuttimeen. Dolby Digitalin tulisi olla taaksepäin yhteensopiva Dolby Surroundiksi. Kanavia on 1-6 (L, R, C, LFE, LS ja RS) ja on mahdollista lisätä taakse keskikanava (CS). Tämä toteutetaan Dolby Surroundista tutulla Pro Logic matriisilla ja tällöin DD saa peräänsä lyhentee EX.

- Tiedosto on nimeltään AC3 (Perceptual Audio Coding ver. 3). Sen pakkaussuhde on noin 11:1. DVD:lle menevän 5.1 tiedoston suositeltava pakkaus on 448 kbps, stereosignaalin 192 kbps. Pakkaussärö joskus kuultavissa.
- Signaali menee tarkasti panorointien mukaan. Jokainen kanava on oma tiedostonsa ennen AC3 -pakkausta ja ohjataan oikeaan kaiuttimeensa (pl. EX)
- LFE kanava on pelkkiä matalia taajuuksia varten. Sen taajuuskaista on 3 - 120 Hz.
- Pääkaiuttimien taajuusvaste on 3 Hz - 20 kHz.
- Sisältää metadataa, eli tietoa dekooderille miten tiedostoa tulisi lukea. Parametrejä ovat mm. Dialnorm, Downmix ja Dynamic Range Control.
- Standardiformaatti DVD:llä. DD:tä ymmärtää jokainen DVD-soitin ja vahvistin. Elokuvateatteriversiota kutsutaan nimellä Dolby SR-D (pakkaus 384 kbps).

Dynamic Theatre System, DTS

DTS on myös diskreetti ääniformaatti ja sisältää samat kanavat kuin DD:kin, sillä erotuksella, että takakeskikanava on myös diskreetti (DTS ES). Voidaan puhua siis todellisesta 6.1 formaatista.

- Pakkaussuhde noin 4:1, 1400 kbps, on muitakin vaihtoehtoja. Paperilla parempilaatuinen kuin DD, käytännössä pakkausalgoritmit niin erilaiset, että jotkin teatterit luopuneet DTS:n käytöstä epämääräisen alapääntoiston takia.
- LFE kanavan taajuusvaste 20 - 80 Hz, etukanavat 20 Hz - 20 kHz, takakanavat 80 Hz - 20kHz.
- Harvinaisempi kuin DD, pidetään "Hi-Fi" -formaattina.
- Ei sisällä metadataa.

Tässä artikkelissa käsitellään vain DD:n ominaisuudet. Halukkaat voivat selvittää DTS:n ominaisuudet itselleen jostain muualta.

AC3 JA METADATA

Perusparametrit

Dolby Digital ei ole sama asia kuin 5.1, vaan siinä voi olla käytössä kanavia yhdestä kuuteen, esimerkiksi 1.0, 3.1 tai 5.0. Pakkausmäärän voi määrittää olevan välillä 32-640 kbps.

- 448 kbps on vakio 5.1 äänelle
- 192 kbps stereolle.
- Monoäänen koodaamiseksi on kaksi eri koulukuntaa. Dolby suosittelee monon olevan 1.0, mutta jossain piireissä monoääni 2.0. 1.0 on oikein, mutta 2.0:a käytetään siksi, että monesti kuluttajilla keskikaiutin on laadultaan heikompi LR kaiuttimia. Näin mono soi stereokannassa, Pro Logic matriisin läpi keskikaiuttimesta. 2.0 monon bitrate on 192 kbps, 1.0 monon 96 kbps.
- 3.1, 4.0 tai vastaavia erikoisempia kanavamääriä varten bitratea ei ole tietääkseni määritelty tarkasti.

Kanavien määrä AC3:ssa merkitään seuraavasti

- 3/2 tarkoittaa kolme etukanavaa, kaksi surroundia
- 2/0 on vakio stereoääni
- 1/0 yksi etukanava, eli mono
- Jne.
- LFE lisätään erikseen. Merkintä /N ei siis ole subwooferien määrä.

AC3:n metadatan kolme tärkeintä parametriä yllä mainittujen lisäksi ovat

a) Dialnorm

b) Downmix

c) Dynamic Range Control

Oikein mitattu ja koodattu kolminaisuus, dialnorm, dynamic range control ja downmix, saavat yhdessä aikaan sen, että 5.1 materiaali on täysin yhteensopiva aina elokuvateatterista monotelkkariin.

Dialnorm

Dialnormilla kerrotaan dekooderille tai vahvistimelle materiaalin dialogin keskimääräinen taso. Dialnormin suurimmat hyödyt tulevat digitelevision myötä. Sen avulla ohjelmamateriaalissa dialogi soi kautta linjan yhtä lujaa riippumatta tv-kanavasta tai materiaalin laadusta. Nykyisellä analogisella verkolla toistettavan materiaalin voimakkuus on tapauskohtausta. Esimerkiksi mainokset tulevat usein lujempaa kuin vaikkapa elokuvat. Dialnormin avulla kuluttaja ei teoriassa joudu koskemaan äänentason säätimiin kerran ne sopiviksi asetettuaan.

- Dialnorm määritellään analysoimalla dialogin keskimääräinen taso.
- Dialnormin asteikko on 0 - -31 dB. Luku 0 tarkoittaa, että kyseistä ohjelmamateriaalia vaimennetaan 31 desibeliä. Luku -31 tarkoittaa, ettei materiaalia vaimenneta lainkaan.
- Jos dialnormin lukema on esimerkiksi -23 dB, materiaalia vaimennettaisiin (31 - 23 =) 8 dB.
- Dekooderi soittaa siis kautta linjan kaiken dialogin -31 dB:n tasolla hiljentämällä lujempaa soivat.
- -31 dB on kovien rymistelyelokuvien erikoistaso, Standarditaso elokuville on -27. Ilmeisesti digitv:n standarditaso Suomessa on -18 dB.

Tästä seuraa suoraan, että jos miksauksessa määritellään dialogi soimaan -31 desibelin tasolla, on ääniefekteille kaikista kovimpien kohtausten huippukohtiin mahdollista laittaa 31 dB dialogia voimakkaampia ääniä (tällöin huiput 0 dB FS -tasolla). Näin elokuvan dynamiikka on iso. Jos taas ohjelmamateriaali on -18 dB:n tasolla, ei huippukohtiin ole varaa enää kuin 18 dB jne.

Dialnormin mittaus tehdään Laeq mittarilla. Se tarkoittaa keskimääräistä äänenpainetasoa A-painotetulla asetuksella. A-painotus tarkoittaa, että mittari on herkin puheäänen taajuuksille. Minulle on toistaiseksi epäselvää, miten dialnormin voi pätevästi mitata ilman Laeq -mittaria. Doom9 -foorumilla on asiaa käsitelty, mutta tätä kirjoittaessa en ole sitä vielä täysin sisäistänyt. Dolby ohjeistaa vertaamaan kaupallisten elokuvien tasoon ja siten määrittämään dialnormin, mutta metodi vaikuttaa epäluotettavalta ja vähintään epätarkalta.

Downmix

Kaikkien monikanavamiksausten pitää olla stereo- ja monoyhteensopivia. Mielellään myös Dolby Surround -yhteensopivia. Jokainen DVD-soitin lähettää ulosmenevänä signaalina niin 5.1 äänen ja siitä tehdyn ns. stereo-downmiksauksen. Downmiksausta varten voi AC3:n metadatassa määritellä arvot, jolla downmiksaukseen vaikutetaan. Downmix parametrit ovat

- Etukanavaa summataan LR kanaviin joko -3 dB, -4.5 dB, -6 dB tai vaimennusta ei tehdä yhtään.
- Takakanavia summataan -3 dB, -6 dB tai ei vaimenneta
- 90 degree phase shift on takakanaville laitettava vaiheenkääntö, jotta ne ovat paremmin Dolby Surround yhteensopivat.
- LFE kanavaa ei summata ikinä!

Testaamalla löytää sopivan tason kullekkin materiaalille. Monoinformaation summaaminen sellaisenaan LR kanaviin nostaa sen tasoa 6 dB:tä. Siksi lähtökohtaisesti kannattaa laittaa monon summauksen tasoksi -3 dB. Takakanavien tason määrää se, miten paljon haluaa tilojen ja pohjien stereossa kuuluvan. Mikään downmix -parametri ei vaikuta 5.1 äänen toistoon.

Downmix ei voi ikinä mennä särölle. Eli jos ajatellaan, että elokuvan huippukohdat käyvät 0 dBFS:n tasolla LR kanavissa ja sen lisäksi keskikanavassa käydään myös nollassa samassa kohtaa, normaalisti summaamalla ääni menisi välttämättä särölle. Downmiksatessa näiden kolmen kanavan summa ei kuitenkaan yliohjaudu, sillä AC-3:ssa on runsaasti headroomia.

Dynamic Range Control, DRC

Dynamic range control toimii yhdessä dialnormin kanssa. Sen avulla laajaa dynamiikkaa käyttävän materiaalin huippukohtia voi leikata ja pohjia nostaa, jotta materiaali ei toistu liian lujaa ja kaikki tarpeellinen kuullaan. DRC:tä käytetään siis litistämään dynaamista alaa. Tästä on hyötyä, jos elokuvaa katsellaan myöhään yöllä eikä haluta häiritä naapureita tai muita perheenjäseniä tai jos elokuvan ääni toistetaan vaikkapa television kaiuttimen kautta.

DRC toimii siis yhdessä dialnormin kanssa. Dialnormista se katsoo tason, jonka ylä- ja alapuolta käsittelee. Käsittelyn määrää saa säätää. Elokuville on muutama vaihtehto

- Film "Standard".
- Film "Light".
- None.

Mikäli dialnorm on oikein säädetty, perusasetus on tietenkin "standard". Jos aivan niin kovaa kompressiota ei haluta käyttää, voi valita "light" -asetuksen. Jos minkäänlaista kompressiota ei laiteta, valitaan kohta "none". Nonen käyttö on perusteltua tilanteissa, joissa dialnormia ei syystä tai toisesta kyetä varmuudella mittaamaan oikein. Väärin mitattu dialnorm yhdessä DRC:n kanssa kompressoi materiaalin väärin ja ääniraita saattaa kuulostaa todella omituiselta ja pumppaavalta. Toisaalta asetuksella "none" hiljaiset äänet saattavat esimerkiksi television kaiuttimesta kuunneltuna kadota tyystin ja kovimmat tulla aivan liian lujaa.

Muut parametrit

Bitraten, kanavamäärän ja ”Kolmen D:n” lisäksi on useita muita parametrejä joihin voi vaikuttaa. Sample Rate on lähdemateriaalin näytteenottotaajuus. RF Overmodulation Protection estää säröytymistä jos signaali lähetetään televisioon antenniliitännän kautta. Surround channel 3 dB attenuator tarkoittaa takakanavien miksaustasoa, ja se on laitetaan päälle jos miksaus on tehty elokuvamiksaamossa tai menee filmille. Loput parametrit, esimerkiksi Original Bit Stream tai Room Type ovat toistaiseksi toisarvoisia, ilman käytännön sovellusta tai pelkästään informatiivisiä. Esimerkiksi Bit stream modessa on monia vaihtoehtoja, mutta näistä ainoa käytössä oleva on ”Complete Main”, eikä dekooderi tee tällä informaatiolla nykyisin mitään. Jollei paremmin tiedä, kannattaa jättää muut parametrit perusasetuksille.

 

 
  jussi.honka(ät)werk23.org http://www.jh.werk23.org