Miten mp3 "toimii" ?

Seuraa 
Viestejä1887
Liittynyt4.3.2007

Niin elikäs mitenhän tuo mp3-formaatti toimii, siis mitä käytännössä tapahtuu äänisignaalille kun se pakataan mp3-muotoon?

Jos ajatellaan vaikkapa jotain kompleksista signaalia, kuten esimerkiksi Metallican ride the lightnign -kappaletta. Häviöttömästä -> mp3 , mitä tapahtuu?

Suomen uusriistokapitalismin pääjehu on Sauli Niinistö. -Pirta-

Kommentit (10)

Vierailija

MP3 on Moving Picture Experts Groupin (MPEG) kehittämä digitaalinen äänisignaalimuoto. Ajatuksena on lähinnä vähentää käytettävän datan määrää muihin (WAV) äänidataa sisältävien tiedostojen datamäärään.

Eli studiossa tuotettu musiikki/ääni muutettuna digitaaliseksi sellaisenaan sisältää vivahteita ja taajuuksia sekä taajuuksien kontrasteja oikeastaan liikaa. Jos siis näin voidaan sanoa. Siis liikaa ihmiskorvalle. MPEG-Ryhmä suunnitteli sitten oman digitaalisen suodattimen (Mp3-data), jossa näitä taajuuksia ja kontrasteja on tasoiteltu tai jopa poistettu, jolloin dataa tarvitaankin vähemmän. Eli vähän kuin olisi "huononnettu" musiikkin laatua(hifi).

Tässä lyhyesti kansanomainen selitys.

JuurikinNiin
Seuraa 
Viestejä1887
Liittynyt4.3.2007

Joo, kyl mä hiffailen.

Mutta teknisestä näkökulmasta ajatellen. Mitkä bitit hylätään ja miksi.

Suomen uusriistokapitalismin pääjehu on Sauli Niinistö. -Pirta-

Vierailija

No siis ei oikeastaa hylätä mitään bittejä vaan niistä muotoutuvaa äänikuvaa ikäänkuin silotellaan ja pienennetään. Eli siis se graafinen viiva jonka varmaan olet joskus nähnyt, niin sitä muokataan suodattimella, niin että siitä tulee vähemmän tilaa vievä. 128 bittinen vaikuttaa siis jopa vähän huonolta ihmiskorvalle. Raja lienee kulkee siinä 192 bittisessä tasossa. Jolloin ei ihmiskorva enää erota ns. laatuheikennystä.

Siis käsittääkseni mitään ei poisteta. Vain "huononnetaan".

http://en.wikipedia.org/wiki/MP3 <--Tuolta saat todella seikkaperäisesti taajuustaulukot mukaanlukien selityksen tähän kysymykseen.

Tuppu L 2.0
Seuraa 
Viestejä3156
Liittynyt25.5.2009
jhn72
128 bittinen vaikuttaa siis jopa vähän huonolta ihmiskorvalle. Raja lienee kulkee siinä 192 bittisessä tasossa. Jolloin ei ihmiskorva enää erota ns. laatuheikennystä.



Tarkoitat ilmeisesti kbps? 8 bittinen ääni itsessään on jo yleensä ihan riitävää, muut häiriöt on usein paljon isompia. 8 bitissä siis on 2^8 eli 256 eri tasoa äänenpaineelle. Käytännössä normaalissa radiomusiikissa se on niin käsiteltyä ja häiriöitynyttä, että pakattuna se riittää aivan hyvin. Asia erikseen on joku hikikorvien ooppera tai ääritilanteet, jolloin 16 bittiä pitäisi olla vähintäänkin tarpeeksi.

Vierailija

Elikkäs jos nyt otetaan ns. häviötön CD-levy, niin musa on tallennettuna sinne 16-bittisinä lukuina 44100 kertaa sekunnissa kahtena kanavana, koska kyseessä on stereoäänite, eli vasemmalle ja oikealle "kaiuttimelle" omat raitansa.

Laskutoimitus: 16 (-bittinen näyte) * 44100 (näytteenottotaajus sekunneissa) * 2 (kanavien määrä) ja saadaan 1 411 200 bittiä per sekunti.

CD-levyn "bitrate" on siis n. 1411 kbps. MP3:ssa se on yleensä jotain siellä 128:n 320:n välissä.

Se, miten MP3 "pakataan," riippuukin sitten hirveän monesta tekijästä. Hyvin raa'asti yksinkertaistettuna se toimii siten, että lähtömateriaalista (esim. CD-levy) pyritään poistamaan "turhia" bittejä pakkausalgoritmin mukaisesti.

Hyvin yksinkertaistettu esimerkki: Kuunneltavassa kappaleessa tulee yhden minuutin täydellinen hiljaisuus. CD-levyllä tämä tarkoittaa sitä, tämä hiljaisuus sanotaan 16-bittisenä lukuna 44100 kertaa sekunnissa kahteen kertaan minuutin ajan "stereoille," tyyliin "0000 0000 0000 0000 0000 0000 0000 0000" (ei mitään). Tämä siis tarkoittaa sitä, että tyhjää tietoa liikkuu edelleen 1411 kbps nopeudella dekooderille. Siis täysin "turhaa" tietoa.

Pakatussa musiikissa voisi tulla viesti dekooderille:"Täydellistä hiljaisuutta minuutin ajan." Tällaisen viestin tulkitseminen vaatii dekooderilta huomattavasti enemmän laskentatehoa. Kun dekooderi ymmärtää tämän, stereot on hiljaa minuutin ajan. Ja seuraavan minuutin ajan tietoa liikkuu 0 kbps. Nyt on saatu minuutti "kuunneltavaa" hiljaisuutta.

Tuppu L 2.0
Seuraa 
Viestejä3156
Liittynyt25.5.2009

Niin, pakkaushan yleensäkin perustuu siihen, että kerrotaan niin vähällä asia kuin vain mahdollista. Esimerkiksi kuvista, äänestä ja videosta etsitään jotain tiettyjä jatkuvuuksia. Nämä sitten trikkejä käyttämällä saadaan muistuttamaan alkuperäistä. Esimerkiksi ihminen ei tajua erilaisia taajuuksia kovinkaan tarkasti tai siniaaltoa, vaan se informaatio huomataan äänen voimistumisesta, vaimenemisesta ja vastaavasta. Eli toisin sanoen äänellä ei ole niin tarkkaa väliä mitä taajuutta se on, kunhan se vain noudattaa muutoksia luonnollisesti. Vaikeimpia huijauksen kohtia on puhe, jonka vivahteisiin ihminsen korva on oikein valveutunut. Ihmiselle ei riitä että puhe kuulostaa jonkun robotin rohinalta, vaan se pitää olla juuri sellaista kun se onkin. Jonkun rummun, pianon tai viulun ääni taas on melko helposti vaikka Commodoren SID-piirillä simuloitavissa. Musiikin purkaminen tai minkään muunkaan tiedon purkaminen ei ole se isoin homma tai ongelma. Paljon isompi kysymys on, että kuinka se tieto saadaan pakattua. Tätä varten täytyy käyttää mitä erilaisempia suodattimia ja kikkailuja. Purkamisessa toki sitten kysymykseksi muodostuu suorituskykyvaatimukset, jotka ei ole yhtä merkittäviä pakatessa.

Tämän sivuston kirjoituksia voi pitää pakattuna. Tämä kaikki näytöllä näkyvä tekstin jokaiselle kirjaimelle on sovittu joku tietty bittijono. Sitten jos vaikka pistät sen lihavoinnin, niin kone tietää siitä eteenpäin tulevan lihavointi kunnes tulee lopetusmerkki. Eli se teksti ei ole itsessään missään, vaan selain itse purkaa sen kuvaksi näytölle. Se kaikki on vain edeltä sovittua ja ohjelmoitua standardia. Ei selain tiedä itse miltä se teksti tulee ruudulla näyttämään, vaan se hakee sovitun fontin merkit jostain. Samoin se tekstin kirjoittaminen vasemmalta oikelle ja ylhäältä alas on vain sopimusta. Kaikki on sovittu jossain ja sen mukaan eletään. Ei selaimesi minunkaan viestini saadessaan saa kuin muutaman kilotavua bittivirtaa, josta sen on yritettävä repiä jotain järkevää näytöntäytettä.

Vierailija

Noniin. Eli hyviä vastauksia kaikki tähän asti, mutta antaisin vielä yhden hyvän esimerkin koskien omaa käsitystäni.

Eli. Muutetaan se oskilloskoopin viiva (äänikuva) vaikkapa legopalikoiksi. Tarkastellaan sitä ääritapausta (korkein aalto). Aalto(yksi satojen joukossa) on vaikkapa 60 legopalikkaa korkea teräväkärkinen muoto. Sitten tulee tämä Mp3-suodatin mukaan joka vaikkapa poistaa kuviosta (muut sarjat mukaanlukien) 80%. Tällöin nyt kyseistä aaltoa kuvaisi 12 palikkaa. Tällöin palikamäärä siis pienentyisi 80%, joten se mahtuisi pienempään tilaan. Tämä samainen pienempi palikkamäärä silti kuullostaa ihmiskorvaan samalta kuin se alkuperäinen määrä.

Tästä siis on kyse.

Saw
Seuraa 
Viestejä6251
Liittynyt20.6.2009

Siinä on high quality MPEG Audio Layer III enkooderin sorsat. http://lame.sourceforge.net/

Jos hyvin käy, siellä voi olla dokumenttejakin niille, joille C ei käänny päässä.

Young man, there's a place you can go.
I said, young man, when you're short on your dough.
You can stay there, and I'm sure you will find
Many ways to have a good time.

It's fun to stay at the Y.M.C.A.
It's fun to stay at the Y.M.C.A.

Pacanus Rusticanus
Seuraa 
Viestejä7843
Liittynyt1.2.2010

Taustakohinaa:

Klassinen yms. kama on yleensä saatavilla flac muodossa ja poppi ämpäreinä.

Flac on muuten hyvä, mutta mielestäni valtavirran mobiilit soittimet eivät juurikaan ole tukeneet sitä. Itselläni on kaikki klassinen silti flacilla koska tarvittaessa voi konvertoida ne siitä mobiililaitteelle ämpäreinä. Mp3 on täysin rektuksesta, mutta silti pakkopullaa, kuten pakkoruotsi ja windows, koska "kaikki" käyttävät sitä. Kun on konvertoitu matskua 20v? 15v? ämpäreiksi, sitä liikkuu mm. verkossa kokolailla paljon. Taitaa olla vuosien saatossa kertynyt itsellekin joku 300 gigaa mp3 äänitiedostoja. On paha tapa säästää kaikki.

Minulla on muuten wanha Audiograbber & Apollo pääasiallisina työkaluina Windowspuolella(+ tietysti parikymmentä muuta harvemmin käytettyä). Kumpaakin pystyy laajentamaan alan harrastajien yms. tuottamilla lisäkkeillä oman maun mukaan jos ei itse osaa vääntää koodia. Minä en osaa. En halua osata. En minä kaiva ojaakaan lapiolla vaan kaivurilla.

http://www.download.fi/cd_dvd/cd_rippau ... rabber.cfm

http://www.download.fi/audio_video/medi ... apollo.cfm

- Ubi bene, ibi patria -

Uusimmat

Suosituimmat