tiistai 29. huhtikuuta 2008

Oppitunnit 8 & 9: Audiokoodaus

  • Audiosignaalin bittinopeus
    • riippuu näytetaajuudesta, bittimäärästä, kanavamäärästä sekä synkronointi- ja virheenkorjausmenetelmästä
    • bittinopeus ilman pakkausta = kanavamäärä * bittimäärä (+ mahd. lisäbitit) * näytetaajuus
  • Audiosignaalin pakkaaminen
    • tarve bittimäärän pienentämiseen
    • häviötön pakkaus
      • vähennetään bittimäärää muuttamatta signaalia
      • alkuperäinen signaali palautettavissa
      • perustuu koodikirjan rakentamiseen
        • usein esiintyville näytteille lyhyt koodi, harvoin esiintyville pitkä
      • pakkaussuhde yleensä vaatimaton
    • häviöllinen pakkaus
      • signaalin huononeminen sallitaan
      • käytetään hyväksi ihmiskorvan ominaisuuksia: mitä ei ihminen kuule, sitä ei tarvitse ottaa mukaan
      • pakkaussuhde jopa 1:10
      • käytetään paljon, yleisimpänä mp3 ja digi-tv
  • Erot puheenkoodaukseen
    • puheenkoodauksessa signaalin luonno tunnetaan (ihmisääntä)
    • audiokoodauksessa äänimateriaali voi olla mitä tahansa
    • audiokoodauksessa ei riitä puhekoodauksen laatu (musiikissa koodausvirheet eivät saa kuulua)
  • Psykoakustiikka
    • poistetaan se mitä ei kuulla
    • psykoakustiset ilmiöt
      • kriittiset kaistat
        • taajuusalueet jotka kuulo käsittelee kokonaisuuksina
      • kuulokynnys
        • äänenpaine jonka alle jäävää ääntä ihminen ei kuule
      • peittoilmiö
        • voimakas ääni peittää hiljaisemmat
  • MPEG-standardit
    • tunnetuimmat standardit MPEG-1 ja MPEG-2
    • lisäksi MPEG-4, MPEG-7 ja MPEG-21
    • MPEG-1 layer 3 eli MP3
      • yleinen tapa lähes CD-tasoisen äänen tehokkaassa pakkauksessa
      • kehittyneempi psykoakustinen malli, kuin layer 1:ssä ja 2:ssa
      • lopullisen bittivirran Huffman-koodaus
      • CD-laadun bittinopeus alle 10% alkuperäisestä
    • MPEG-2 AAC
      • "seuraavan sukupolven audiokoodekki"
      • mp3:n äänenlaatu 30% pienemmällä bittinopeudella
      • monikanavaääni (1-48 kanavaa, 0-16 efektikanavaa)
      • parempi taajuusresoluutio
      • monen symbolin Huffman-koodaus
      • siistimpi kehysten vaihto
      • aika-alueen kohinanmuokkaus
  • Muita standardeja
    • AC-3 eli Dolby Digital
      • 5.1-elokuvaääni (left, center, right, left-surround, right-surround ja LFE)
    • Dolby E
    • Sony ATRAC
    • Microsoft WMA
    • RealNetworks G2 Music Codec
    • Lucent PAC ja EPAC

Oppituntien aihe oli ehkä muita tutumpi jo valmiiksi joten tässä ei niin paljon uutta tullut kuin edellisissä. Bittinopeudet ja muut on näin puhelintekniikkaa opiskelleelle jo tuttua puuhaa, kuten puheen pakkaaminenkin. MPEG-standardit olivat taas tuttuja multimediateknologian puolelta. Myös ihmiskorvan heikkouksien hyväksikäyttö on jo tullut tutuksi. Tällä kertaa meni siis aika paljon vanhoja kerratessa. Hyvä kertausta silti. Tärkeitä asioita nämä pakkaamiset.

Ei kommentteja: