MP3

Vikipēdijas raksts
Pārlēkt uz: navigācija, meklēt

MPEG-1 Audio Layer 3, plašāk pazīstams kā mp3 ir populārs digitālās skaņas kodēšanas standarts ar kura palīdzību iespējams ievērojami samazināt datu apjomu, kas vajadzīgs lai, piemēram, atskaņotu vai saglabātu skaņas failu. Šo standartu izstrādāja vācu inženieri un tas kļuva par ISO/IEC standartu tālajā 1991. gadā.

Mp3 ir specifisks audio kompresijas formāts, kurš nodrošina impulskoda modulācijas šifrēšanu, lai ar tās palīdzību filtrētu skaņas, kuras cilvēks nedzird vai kuras pārklājas ar citām skaņām. Līdzīgi principi ir lietoti JPEG formātā, kurš nodrošina minimālu attēla kvalitātes zudumu, taču attaisno mērķi — samazināt faila izmērus.

Mp3 formāts izmanto hibrīd — transformāciju lai transformētu laika apgabala signālu frekvences apgabala signālā.

  • 32 frekvenču joslas daudzfāzu kvadratūras filtru.
  • 36 vai 12 uzsitienu MDCT (modificētu atsevišķu kosinusu pārveidošanu); izmērs var tikt atlasīts neatkarīgi priekš apakš-frekvencēm 0...1 un 2...31.
  • Aliasing (cēlonis dažādu signālu kļūšanai neatšķiramiem kad tos nolassa) samazināšanas pēcapstrāde.

Mp3 skaņa var tikt kompresēta ar vairākiem bit-rate (bitu pārraides daudzums), nodrošinot lielu izvēli starp datu izmēru un skaņas kvalitāti. MPEG instrukcijas atbalsta uzlaboto audio kodēšanu (ACC) no MPEG-4 pēctečiem, kaut arī citi jauni audio formāti ir sasnieguši līdzīgus izmantošanas līmeņus, lai arī mp3 lielā popularitāte nodrošina tam drošu pastāvēšanu un dominanci tuvākajā nākotnē, pateicoties lielam daudzumam aparatūras un programmatūras nodrošinājumus, kā arī MP3 pārnēsājamiem atskaņotājiem, CD-atskaņotājiem, DVD atskaņotājiem un mobilajiem telefoniem.

Mp3 izveide[izmainīt šo sadaļu | labot pirmkodu]

MPEG Audio Layer-2 šifrēšana sākās kā Digital Audio Broadcast (DAB) - (digitālās skaņas apraide) projekts Egon Meier - Engelen vadībā Vācu Kosmiskajā Centrā (German Aerospace Center) Vācijā. Šis projekts tika finansēts no Eiropas Savienības (ES) līdzekļiem kā daļa no EUREKA izpētes programmas, kur to vairāk atpazīst kā EU-147. EU-147 strādāja no 1987. līdz 1994. gadam. 1991. gadā bija divi priekšlikumi: MUSICAM (zināms kā Layer-2), un ASPEC (Adaptīvais Spektrālais Perceptuālais Entropijas Kodējums). Musicam tehnika ko ierosināja Philips (Nīderlande), CCET (Francija) un Institut fur Rundfunktechnik (Vācija) tika aizvērts dēļ tā vienkāršuma un robusto kļūdu dēļ, zema aprēķināšanas spēja saistīta ar augstas kvalitātes kompresētā audio kodēšanu. Musicam formāts - bāzēts uz apakš-frekvenču joslas šifrēšanu, bija atslēga lai dibinātu pamatus MPEG Audio Kompresijas Formātam (paraugu vērtības; struktūras uzbūve; headers -pirmie ieraksti, kas identificē datni; piemēru skaits kadrā). Šīs tehnoloģijas un idejas bija pilnībā iekļautas ISO MPEG Audio Layer I un Layer II definējumā un tālāk Layer III (Mp3) formātā. Zem priekšsēdētāja Profesora Mussmann (Hannoveres Universitāte) un Gerhard Stoll (Layer II). Darba grupa sastāvot no Leon Van de Kerkhof (Nīderlande), Gerhard Stoll (Vācija), Leonardo Chiarilione (Itālija), Yves-Francois Dehery (Francija), Karlheinz Brandenburg (Vācija) aizguva idejas no Musician un ASPEC, pievienoja dažas to idejas un izveidoja mp3, kurš tika radīts lai sasniegtu to pašu kvalitāti uz 128 kbit/s, ko mp2 uz 192 kbit/s. Visi algoritmi tika pārbaudīti 1991.gadā, pabeigti 1992. kā daļa no MPEG-1, pirmais standart-komplekts pie MPEG, kā rezultāts bija internacionālais standarts ISO/IEC 11172-3, publiskots 1993.gadā. Turpmākais darbs pie MPEG audio tika beigts 1994.gadā, kā daļa no otrā komplekta priekš MPEG standartiem, MPEG-2, vairāk formāli pazīstams kā internacionāls standarts ISO/IEC 13818-3, sākotnēji publicēts 1995. gadā. Kompresijas efektivitāte kodētājiem ir tipiski definēta pēc bitu intensitātes, tādēļ ka kompresijas intensitāte ir atkarīga no bitu platuma un parauga intensitātes pēc ievada signāla. Tomēr, bieži tiek publicēti kompresijas likmes kuras izmanto CD parametrus kā atsauksmes (44.1 kHz, 2 kanāliem ar 16 bitiem katrā kanālā vai 2x16 bit). Dažreiz DAT (Digitālās Audio Lentes) SP parametru izmantošana (48 kHz, 2x16 bit). Kompresijas indekss ar šo raksturojumu ir lielāks, kurš demonstrē problēmu terminam „kompresijas indekss” priekš zudumradošajiem kodētājiem.

Kļūstot publiskam[izmainīt šo sadaļu | labot pirmkodu]

Atsauces simulācijas programmatūras īstenošana, izveidota ar C valodu un zināma kā ISO 11172-5, tika izveidota ar dalībnieku palīdzību, kuri sastāvēja ISO MPEG Audio komitejā ar uzdevumu izveidot bitu piekāpjošos MPEG Audio failus (Layer 1, Layer 2, Layer 3). Darbojoties laikā kad nebija pieejamas daudzas operētājsistēmas, bija iespējams demonstrēt pirmās reālā laika iekārtu dekodēšanu (DSP bāzētu) kodētai skaņai. Daži citi reālā laika izpildīšanas MPEG Audio kodētāji bija pieejami priekš nodomu priekš digitālās translēšanas (radio DAB, televīzijas DAB) uz patērētāju uztvērējiem un uzstādītajiem televizoriem.

Mp2[izmainīt šo sadaļu | labot pirmkodu]

1993.gada oktobrī Mp2 (MPEG-1 Audio Layer 2) faili parādījās internetā un tika bieži spēlēti, izmantojot Xing MPEG Audio Player, un vēlāk programmā priekš UNIX kuru veidoja Tobias Bading, saukts par MAPlay , kurš tika izlaists 22.februārī,1994. MAPlayer arī tika pārnests uz Microsoft Windows OS.

Internetā[izmainīt šo sadaļu | labot pirmkodu]

Pirmajā pusgadā 1995.gadā pēc vēlajiem deviņdesmitajiem mp3 faili sāka parādīties Internetā. Mp3 popularitāti noteica tas, ka kompānijas izlaida programmnodrošinājumu, tādu, kā piemēram, Nullsoft Winamp (izlaists 1997), mpg123 un Napster (izlaists 1999). Šīs programmas nodrošināja vieglu un ātru faila iegūšanu un atskaņošanu, veidošanu un kolekcionēšanu. Tas izraisīja asas diskusijas par autortiesībām jo pateicoties kompresijai faili kļuva izmēros mazi, viegli un ātri ielādējami kas agrāk nebūtu bijis tik viegli izdarāms failu izmēru dēļ. Dažas lielās izdevējkompānijas sāka tiesas procesu pret Napster ar kura palīdzību lietotāji apmainījās mp3 failiem. Napster bija centralizēts failu apmaiņas serveris, kuru slēdza. Kompānijas it kā apmierināja savas pretenzijas, taču tas bija iemesls tam, ka mūsdienās šie serveri kļuva decentralizēti, piemēram DC++ utt. Pašlaik ir izveidoti daudzi resursi internetā, kuros ir iespējams legāli par samaksu lejupielādēt mūzikas failus, taču tas nenes lielus rezultātus, jo retais maksās par to, ko var dabūt par velti. Notiek diskusijas arī par to, vai vispār neatcelt autortiesības, piemēram, uz mūziku, kuras tā pat neviens neievēro, pamatojot to ar māksliniekiem iegūt savu atlīdzību ar koncertu un reklāmu palīdzību.

Mp3 - izstrādāts ciparu skaņas saspiešanas algoritms, kas divpadsmitkārt saspiež audio informāciju, saglabājot skaņas kvalitāti. To panāk, izmantojot saspiešanā cilvēkiem uztveramās skaņas diapazonu un ievērojot, ka šis diapazons ir ierobežots.

Skaņas kodēšana[izmainīt šo sadaļu | labot pirmkodu]

Skaņu (arī citas svārstības) var sadalīt atsevišķās sastāvdaļās, jeb sadalīt “pa frekvencēm”. Bet katras šādas sastāvdaļas vērtību kādā noteiktā laika momentā var izrēķināt, jo to apraksta ar visiem labi zināmo sinusa funkciju. Signālu sadala pa atsevišķām sinusoīdām, kur katra tiek raksturota ar trīs parametriem: frekvence, amplitūda, fāzes nobīde. MPEG-1 sevī neietver tādas specifiskas īpašības kā mp3. Atšifrēšanas algoritms un faila formāts labi kontrastē, kas ir skaidri definēts. Parasti konstruktori izveidoja standarta algoritmus priekš izņemamo skaņas apgabalu (drīzāk tas ir MDCT reprezentācija frekvences apgabalā). Kodēšanas laikā 576 apgabala paraugi tiek ņemti un pārkodēti 576 frekvenču apgabala paraugos. Ja tur ir 576 apgabali, tad tikai 192 tiek ņemti vērā. Tas ir psiho-akustiskais jēdziens, cilvēka subjektīvās skaņas uztveršanas spēju studēšana, pētīšana. Kā rezultātā, daudzi atšķirīgi mp3 kodētāji ir pieejami, atšķirības ir tikai skaņas kvalitātē. Salīdzinājumi ir plaši pieejami, tā kā tie ir vienkārši priekš kodētāja, lai nākamajā projektā izdarītu labāko izvēli, mācoties no šiem salīdzinājumiem. Tos vajag saglabāt prātā, ka kodētājs, kuri ir prasmīgi atkodēšanai pie augstas bitu pārraides ātruma (kā piemēram LAME, kurš ir plaši izplatīts priekš kodēšanas uz augstiem bitu pārraides ātrumiem), ir ne obligāts kā citi, priekš zemiem pārraides ātrumiem. Skaņu no analogā signāla digitālajā pārveido, ik pēc noteikta laika sprīţa mērot elektriskā signāla lielumu un tam piešķirot bināru vērtību. Jo bieţāk šos mērījumus veic, jo iegūst labāku skaņas kvalitāti. Viens mērījums sekundē ir viens hercs (Hz), bet 1000 mērījumu viens sekundē –viens kilo hercs (KHz).

Skaņas atšifrēšana[izmainīt šo sadaļu | labot pirmkodu]

Pirmām kārtām mp3 dekoderī var būt iekļauta ekvalaizera (equalizer) funkcija, kas patērē 0 resursu. Kodēšana iekš mp3 notiek ar skaitļiem diapazonā —1..0..1, un, lai šo diapazonu varētu attēlot ar 8, 16, 24, … bitu veselu skaitli, ko nodod skaņas kartei atskaņošanai, šiem mazajiem skaitļiem tiek piekārtots attiecīgs reizinātājs. Mainot šos reizinātājus, mainās arī skaņas sastāvdaļas. Tātad mēs vienkārši mainam dekodēšanas parametrus. Otra lieta ir tā, ka arī dekoderu rezultāts var būt dažāds, jo ne visi šo daļu ir realizējuši tā kā tam būtu jābūt, t.i., daži dekoderi ir optimizēti veiktspējai tā, ka samazinās rezultāta kvalitāte. Bet šobrīd tādus dekoderus jau ir grūti atrast. Trešā lieta ir tā, ka dekodēšanas kvalitāte var tikt samazināta, lai samazinātu resusru patēriņu. Šīs izmaiņas dekodēšanā tiek panāktas ignorējot kādu daļu no skaņas sastāvdaļām. Tātad tiek izdarīta tikai daļa no dekodēšanas darba. Šādas iespējas ir arī, piemēram, WinAmp MPEG dekoderī sadaļā Quality ir iespējas: Full, Half, Quarter. Ceturtā lieta ir tāda, ka patiesībā mp3 var tikt dekodēts jebkurā diskretizācijas frekvencē (sampling rate), jo signāls taču ir aprēķināma viļņa formā. Bet jāņem vērā, ka kvalitāti tas neuzlabo. Atšifrējums tiek strikti noteikts standartā. Dešifratori visvairāk ir bitu straumes piekāpīgie, kas nozīmē, ka dekompresēti, piemēram, no mp3 tie pieļauj apaļošanu, kā standarta ISO/ECO dokumentos ir noteikts. Mp3 failam ir standarta formāts, kura rāmītis pastāv no 384, 576, vai 1152 paraugiem (atkarīgs no MPEG versijas un skaņas saspiešanas līmeņa) un visi rāmīši ir sasaistījuši maģistrāles informāciju (32 biti) un sānisko informāciju (9, 17, vai 32 baiti, atkarībā no MPEG versijas un noteikuma: stereo vai mono). Maģistrāle un sāniska informācija palīdz dešifratoram pie dekodēšanas sasaistīto Hufmaņa kodēto datu pareizības. Tādēļ, galvenokārt, dešifratoru salīdzinājums tiek gandrīz salīdzināti uz aprēķināšanas faktoriem tie ir (piemēram, cik daudz atmiņas un CPU resursus tie patērē dekodēšanas procesā).

Bita norma[izmainīt šo sadaļu | labot pirmkodu]

Bitu normas ir mainīgas priekš mp3 failiem. Kopīgais likums ir, ka vairāk informācija tiek iekļauta no orģinālās s skaņas faila, kad tiek izmantota augsta bita norma, un tāpēc augstāka kvalitāte laikā atskaņojama. Pa mp3 koda agrajām dienām, izlabota bita norma tika izmantota priekš pilnā faila. Bita normas, kas pieejams MPEG-1 Layer-3 virsslāņos ir 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 un 320 kbit/s, un pieejamie frekvenču biežumi ir 32, 44.1 un 48 kHz. 44.1 kHz tiek gandrīz vienmēr izmantots (sakrīt ar kompakt diska normu), un 128 kbit/s ir tapis priekš apmierinoša standarta, neskatoties uz to, ka 192 kbit/s ir populārākie failu apmaiņas tīklos. MPEG-2 un (neoficiālas) MPEG-2.5 iekļauj dažas papildus bitu normas: 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144, 160 kbit/s; kamēr nodrošina zemākus frekvenču biežumus (8, 11.025, 12, 16, 22.05 un 24 kHz). Mainīga bitu norma (VBR) ir iespējama. Skaņa MP3 failos tiek dalīta rāmīšos, kurš katram ir viņa personīgā bitu norma, tā kā ir iespējams pie izmainītiem bita normu dinamiski kodēt. Šī tehnika dara visu iespējamo lai izmantotu vairāk bitus priekš skaņas daļām ar augstu dinamiku (vairāk skaņas kustībām) un mazākiem bitiem priekš daļām ar zemu dinamiku, bez tam palielina kvalitāti un atmiņas atstarpes samazināšanos. Piemēram, daļa mierīgo tīro toņu varēja būt kodēts uz 48 kbit/s, dod mazāku atstarpi bez jebkuras manāmas starpības, tai laikā kad atskaņots pilns simfoniskais orķestris, tiek kodēta uz 224 kbit/s pie lielas izšķirtspējas. Kaut arī neorģināli īstenoja, daudzi kodētāji pašlaik izmanto šo tehniku pie liela vai mazāka paplašinājuma iegūšanas. Nestandarta bitu līneņi līdz pat 640 kbit/s var būt sasniegts ar LAME kodētāju pie free-format (brīvā formāta) izvēles, bet tikai daži mp3 spēlētāji var palaist šos failus. Gabriels Bouvings, LAME projekta galvens izstrādātājs, piedāvāja nākamo informāciju par free-format: "free-format ir piekāpīgs pie mp3 standarta. Dešifratori tiek pieprasīti pie varbūtības dekodēt to līdz pat 320kbps, bet atšifrējums augstas bitrate free-format straumes ir neobligāts. Praktiski, tas nozīmē ka ne augstāk kā 320kbps, jo tikai daži dešifratori atbalsta to."

Skaņas kvalitāte[izmainīt šo sadaļu | labot pirmkodu]

Tā kā mp3 ir zudumradošs formāts, tas var nodrošināt atšķirīgu izvēļu rindu priekš viņa "bita normas" - kas ir, kodēto datu, kurš tiek izmantots pie iedomātas katras skaņas sekundes, bitu skaitļa. Tipiski, normas izvēlētas ir starp 128 un 320 Kbit pa sekundi. By kontrasts, atkodētā skaņa tiek saglabāta kā uz kompakt diska: 1411.2 Kbit/s normas (16 biti/paraugā × 44100 paraugi/sekundē × 2 kanāliem). Mp3 faili kodēts ar zemu bita normu, lai kopumā atskaņotu zemā kvalitātē. Ar pārāk zemu normu, skaņas, kura nebija klāt orģinālajā ierakstā, var rasties atražošanā. Blīvēšanās eksponātu laba demonstrācija tiek nodrošināta ar aplausu skaņu: tas ir grūts pie saspiešanas dēļ nejauša vai asa trokšņa. Tādēļ blīvēšanās eksponāti ir skaņas kā šķindoņa vai pirmsatdarināšana. Tāpat kā kodētā faila bita norma, mp3 failu kvalitāte ir atkarīga no kodētāja kvalitātes un grūtuma kādā signāls tiek kodēts. Kā MP3 standarts pieļauj brīvību ar ne mazums kodēšanas algoritmiem, atšķirīgi kodētāji var interpretēt visai citu kvalitāti, pat tad, kad uzdod tamlīdzīgas bitrates. Kā piemērs, kopīgs kopu tests notēlo divus atšķirīgus mp3 kodētājus uz 128kbps, viens ievinnēja 3.66 no 1-5 mērogs, tai laikā kāds cits ievinnēja tikai 2.22. Kvalitāte ir smagi atkarīga no kodētāja izvēles un kodēšana parametriem. Tai laikā kad kvalitāte ir ap 128kbps, bija pieņemams ar vecākajiem kodētājiem, mūsdienu mp3 kodētāji var nodrošināt ļoti labu kvalitāti uz to pašu bitrate, ne ļoti atšķirīgu no kvalitātes kuru nodrošina AAC, mp3 tehniskais pēctecis. Tomēr, 1998.gadā, mp3 uz 128kbps tikai nodrošināja kvalitatīvu ekvivalentu pie AAC-LC uz 96kbps un mp2 uz 192 kbps. Mp3 caurspīdīguma slieksnis var būt vērtēts pie 128kbps ar labiem kodētājiem uz tipiskas mūzikas kā pierādīts pēc viņa spēcīgā darba iepriekšminētajā izmēģinājumā, tomēr dažs īpaši grūts materiāls var pieprasīt 192kbps vai augstāk. Kā visi zudumradošie formāti, daži paraugi var nebūt kodēti izcili caurspīdīgi pie visiem patērētājiem. Tādēļ daudzi patērētāji izvēlējās 192 Kbps. Pie zemas bitrates, mp3 kvalitāte ātri pazeminās, un ir tālu aizmugurē AAC kvalitātei ar 32kbps, kā demonstrēts kopu klausīšanās testā. Tas ir tāpat svarīgs pie atzīmes, ka manāmu kvalitāti var būt iespaidojuši klausīšanās vide (apkārtējs troksnis), klausītāja uzmanību, un klausītāju apmācība.

Faila struktūra[izmainīt šo sadaļu | labot pirmkodu]

Mp3 fails tiek izgatavots no daudzējādiem mp3 rāmīšiem, kuri sastāv no mp3 maģistrāles un mp3 dati. Rāmīšos šis secīgums tiek dēvēts par elementāro straumi. Rāmīši ir neatkarīgi elementi: viens var izgriezt rāmīšus no faila un mp3 spēlētājam vajag palaist to. Mp3 dati ir faktiskās skaņas neatbilstoši. Grafiskajā demonstrēšanā, ka mp3 maģistrāle sastāv no sinhronas vērtības, kura tiek izmantota pie īstās rāmīša vērtības noteikšanas. Šis nedaudz norāda ka šis ir MPEG standarts un divus bitus, kurš norāda ka Layer-3 tiek izmantots, kopš šā brīža MPEG-1 skaņas līmenis Layer-3 vai MP3. Pēc tam, kad šis, vērtības var atšķirties atkarībā no mp3 faila. Nozīmju diapazons priekš maģistrāles katras sekcijas līdzās maģistrāles specifikācijai tiek noteikts ISO standarta. Mp3 faili bieži satur ID3 metadatus galvenajai daļai vai seko mp3 rāmīšiem.