MP3

Z Wikipédie, voľnej encyklopédie
Prejsť na navigáciu Prejsť na vyhľadávanie

MP3
Mp3.svg
Prípona názvu súboru.mp3
.bit(pred rokom 1995) [1]
Typ internetového média
  • audio/mpeg[2]
  • audio/MPA[3]
  • audio/mpa-robust[4]
VyvinutýKarlheinz Brandenburg , Ernst Eberlein, Heinz Gerhäuser, Bernhard Grill , Jürgen Herre a Harald Popp (všetci Fraunhofer Society ), [5] a ďalší
Prvotné uvoľnenie6. decembra 1991 ; pred 30 rokmi [6] ( 1991-12-06 )
Najnovšie vydanie
ISO/IEC 13818-3:1998
apríl 1998 ; pred 24 rokmi ( 1998-04 )
Typ formátuStratový zvuk
ObsahujeMPEG-ES
Normy
Otvorený formát ?áno [9]
Voľný formát?Patenty, ktorých platnosť vypršala [10]

MP3 (formálne MPEG-1 Audio Layer III alebo MPEG-2 Audio Layer III ) [4] je kódovací formát pre digitálny zvuk vyvinutý z veľkej časti Fraunhoferovou spoločnosťou v Nemecku s podporou ďalších digitálnych vedcov v Spojených štátoch a inde. Pôvodne definovaný ako tretí zvukový formát štandardu MPEG-1 bol zachovaný a ďalej rozšírený – definoval ďalšie bitové rýchlosti a podporu pre viac zvukových kanálov – ako tretí zvukový formát nasledujúceho MPEG-2.štandardné. Tretia verzia, známa ako MPEG 2.5 – rozšírená tak, aby lepšie podporovala nižšie bitové rýchlosti – je bežne implementovaná, ale nie je uznávaným štandardom.

MP3 (alebo mp3 ) ako formát súboru bežne označuje súbory obsahujúce elementárny prúd dát kódovaných MPEG-1 Audio alebo MPEG-2 Audio, bez ďalších zložitostí štandardu MP3.

Čo sa týka kompresie zvuku (aspekt štandardu, ktorý je pre koncových používateľov najzrejmejší a pre ktorý je najznámejší), MP3 používa stratovú kompresiu údajov na kódovanie údajov pomocou nepresných aproximácií a čiastočné vyradenie údajov. To umožňuje veľké zníženie veľkosti súborov v porovnaní s nekomprimovaným zvukom. Kombinácia malej veľkosti a prijateľnej vernosti viedla k rozmachu distribúcie hudby cez internet v polovici až koncom 90. rokov, pričom MP3 slúžila ako podporná technológia v čase, keď bola šírka pásma a úložisko stále na prvom mieste. Formát MP3 sa čoskoro začal spájať s kontroverziami okolo porušovania autorských práv , hudobného pirátstva a kopírovania / zdieľania súborov.služby MP3.com a Napster , medzi inými. S príchodom prenosných prehrávačov médií , produktovej kategórie, ktorá zahŕňa aj smartfóny , zostáva podpora MP3 takmer univerzálna.

Kompresia MP3 funguje tak, že znižuje (alebo aproximuje) presnosť určitých zložiek zvuku, ktoré sa považujú (podľa psychoakustickej analýzy) za sluchové schopnosti väčšiny ľudí. Táto metóda sa bežne označuje ako percepčné kódovanie alebo ako psychoakustické modelovanie. [11] Zostávajúce zvukové informácie sa potom zaznamenajú priestorovo efektívnym spôsobom pomocou algoritmov MDCT a FFT . V porovnaní s digitálnym zvukom v kvalite CD môže kompresia MP3 bežne dosiahnuť 75 až 95 % zmenšenie veľkosti. Napríklad súbor MP3 zakódovaný s konštantnou bitovou rýchlosťou 128 kbit/s by viedol k súboru s veľkosťou približne 9 % pôvodného zvukového disku CD. [12]Začiatkom roku 2000 prehrávače kompaktných diskov čoraz viac podporovali prehrávanie súborov MP3 na dátových CD.

Moving Picture Experts Group ( MPEG) navrhla MP3 ako súčasť svojich štandardov MPEG-1 a neskôr MPEG-2 . MPEG-1 Audio (MPEG-1 Part 3), ktorý zahŕňal MPEG-1 Audio Layer I, II a III, bol schválený ako návrh komisie pre normu ISO / IEC v roku 1991, [13] [14] dokončený v roku 1992, [15] a publikované v roku 1993 ako ISO/IEC 11172-3:1993. [7] Rozšírenie MPEG-2 Audio (MPEG-2 Part 3) s nižšími vzorkovacími a bitovými rýchlosťami bolo publikované v roku 1995 ako ISO/IEC 13818-3:1995. [8] [16]Vyžaduje len minimálne úpravy existujúcich dekodérov MPEG-1 (rozpoznanie bitu MPEG-2 v hlavičke a pridanie nových nižších vzorkovacích a bitových rýchlostí).

História

Pozadie

Algoritmus stratovej kompresie zvukových dát MP3 využíva percepčné obmedzenie ľudského sluchu nazývané maskovanie sluchu . V roku 1894 americký fyzik Alfred M. Mayer uviedol, že tón sa môže stať nepočuteľným iným tónom s nižšou frekvenciou. [17] V roku 1959 Richard Ehmer opísal kompletný súbor sluchových kriviek týkajúcich sa tohto javu. [18] V rokoch 1967 až 1974 Eberhard Zwicker pracoval v oblasti ladenia a maskovania kritických frekvenčných pásiem, [19] [20] čo zase stavalo na základnom výskume v tejto oblasti od Harveyho Fletchera a jeho spolupracovníkov v Belle . Laboratóriá. [21]

Percepčné kódovanie sa prvýkrát použilo na kompresiu kódovania reči pomocou lineárneho prediktívneho kódovania (LPC), [22] ktoré má pôvod v práci Fumitada Itakura ( Nagoya University ) a Shuzo Saita ( Nippon Telegraph and Telephone ) v roku 1966. [23] V roku 1978 , Bishnu S. Atal a Manfred R. Schroeder v Bell Labs navrhli kodek reči LPC , nazývaný adaptívne prediktívne kódovanie , ktorý využíval psychoakustický kódovací algoritmus využívajúci maskovacie vlastnosti ľudského ucha. [22] [24]Ďalšia optimalizácia od Schroedera a Atala s JL Hallom bola neskôr uvedená v článku z roku 1979. [25] V tom istom roku navrhol psychoakustický maskovací kodek aj MA Krasner, [26] ktorý publikoval a produkoval hardvér pre reč (nie je použiteľný ako bitová kompresia hudby), ale zverejnenie jeho výsledkov v relatívne nejasnom Lincolnovom laboratóriu Technická správa [27] bezprostredne neovplyvnila hlavný prúd vývoja psychoakustických kodekov.

Diskrétnu kosínusovú transformáciu (DCT), typ transformačného kódovania pre stratovú kompresiu , navrhnutý Nasirom Ahmedom v roku 1972, vyvinul Ahmed s T. Natarajanom a KR Raom v roku 1973; svoje výsledky publikovali v roku 1974. [28] [29] [30] To viedlo k vývoju modifikovanej diskrétnej kosínovej transformácie (MDCT), ktorú navrhli JP Princen, AW Johnson a AB Bradley v roku 1987, [31] po predchádzajúcej práci Princen a Bradley v roku 1986. [32] MDCT sa neskôr stalo základnou súčasťou algoritmu MP3. [33]

Ernst Terhardt a kol. skonštruoval algoritmus popisujúci maskovanie sluchu s vysokou presnosťou v roku 1982. [34] Táto práca sa pridala k rôznym správam autorov pochádzajúcich už od Fletchera a k práci, ktorá pôvodne určovala kritické pomery a kritické šírky pásma.

[22] V roku 1988 recenzovaný časopis IEEE Journal on Selected Areas in Communications informoval o širokej škále (väčšinou percepčných) algoritmov kompresie zvuku . zavedené, fungujúce technológie kompresie bitov zvuku, [35] niektoré z nich používajú sluchové maskovanie ako súčasť ich základného návrhu a niektoré zobrazujú hardvérové ​​implementácie v reálnom čase.

Vývoj

Genéza technológie MP3 je plne opísaná v článku profesora Hansa Musmanna, [36] ktorý niekoľko rokov predsedal skupine ISO MPEG Audio. V decembri 1988 MPEG požadoval štandard kódovania zvuku. V júni 1989 bolo predložených 14 algoritmov kódovania zvuku. Kvôli určitým podobnostiam medzi týmito návrhmi kódovania boli zoskupené do štyroch vývojových skupín. Prvou skupinou bola ASPEC od Fraunhofer Gesellschaft , AT&T , France Telecom , Deutsche a Thomson-Brandt . Druhá skupina bola MUSICAM od Matsushita , CCETT , ITT a Philips . Treťou skupinou bol ATAC (ATRAC Coding), podľaFujitsu , JVC , NEC a Sony . A štvrtá skupina bola SB-ADPCM od NTT a BTRL. [36]

Bezprostrednými predchodcami MP3 boli „Optimum Coding in the Frequency Domain“ (OCF), [37] a Perceptual Transform Coding (PXFM). [38] Tieto dva kodeky spolu s príspevkami Thomson-Brandt na prepínanie blokov boli zlúčené do kodeku s názvom ASPEC, ktorý bol predložený MPEG a ktorý vyhral súťaž kvality, ale bol omylom zamietnutý ako príliš zložitý na implementáciu. Prvou praktickou implementáciou audio perceptuálneho kodéra (OCF) v hardvéri (Krasnerov hardvér bol príliš ťažkopádny a pomalý na praktické použitie) bola implementácia psychoakustického transformačného kodéra založeného na čipoch Motorola 56000 DSP .

Ďalší predchodca formátu a technológie MP3 sa nachádza vo vnemovom kodeku MUSICAM založenom na celočíselnej aritmetike 32 subpásmových filtrov, riadených psychoakustickým modelom. Primárne bol navrhnutý pre Digital Audio Broadcasting (digitálne rádio) a digitálnu TV a jeho základné princípy boli vedeckej komunite odhalené CCETT (Francúzsko) a IRT (Nemecko) v Atlante počas konferencie IEEE-ICASSP v roku 1991, [39] po tom, čo od roku 1989 pracoval na MUSICAM so spoločnosťami Matsushita a Philips. [36]

Tento kodek začlenený do vysielacieho systému pomocou COFDM modulácie bol demonštrovaný vo vzduchu a v teréne [40] s Radio Canada a CRC Canada počas NAB show (Las Vegas) v roku 1991. Implementácia zvukovej časti tohto vysielacieho systému bola založená na na dvojčipovom kódovači (jeden pre subpásmovú transformáciu, jeden pre psychoakustický model navrhnutý tímom G. Stolla (IRT Nemecko), neskôr známy ako psychoakustický model I) a dekodéri v reálnom čase využívajúcom jeden spustený čip Motorola 56001 DSP celočíselný aritmetický softvér navrhnutý tímom YF Deheryho ( CCETT, Francúzsko). Jednoduchosť príslušného dekodéra spolu s vysokou kvalitou zvuku tohto kodeku, ktorý prvýkrát používa vzorkovaciu frekvenciu 48 kHz, vstupný formát 20 bitov/vzorka (najvyšší dostupný štandard vzorkovania v roku 1991, kompatibilný s profesionálnym digitálnym AES/EBU vstupné štúdio) boli hlavnými dôvodmi na neskoršie prijatie charakteristík MUSICAM ako základných funkcií pre pokročilý kodek digitálnej kompresie hudby.

Počas vývoja kódovacieho softvéru MUSICAM tím Stolla a Deheryho dôkladne využil súbor vysokokvalitného materiálu na hodnotenie zvuku [41] , ktorý vybrala skupina audio profesionálov z Európskej vysielacej únie a ktorý sa neskôr použil ako referencia pre hodnotenie. kodekov kompresie hudby. Zistilo sa, že technika subpásmového kódovania je efektívna nielen pre percepčné kódovanie vysokokvalitných zvukových materiálov, ale najmä pre kódovanie kritických perkusívnych zvukových materiálov (bicie, trojuholník,...), vďaka špecifickému efektu dočasného maskovania. subpásmovej filtračnej banky MUSICAM (táto výhoda je špecifická vlastnosť techník krátkeho transformačného kódovania).

Karlheinz Brandenburg ako doktorand na nemeckej univerzite v Erlangen-Norimbergu začal začiatkom 80. rokov pracovať na digitálnej kompresii hudby, pričom sa zameral na to, ako ľudia vnímajú hudbu. Svoju doktorandskú prácu dokončil v roku 1989. [42] MP3 je priamym potomkom OCF a PXFM, čo predstavuje výsledok spolupráce Brandenburgu – pracuje ako postdoktorandský výskumník v AT&T-Bell Labs s Jamesom D. Johnstonom ("JJ") z AT&T-Bell Labs — s Fraunhofer Institute for Integrated Circuits , Erlangen (kde spolupracoval s Bernhardom Grillom a štyrmi ďalšími výskumníkmi – „The Original Six“ [43]), s relatívne menšími príspevkami od MP2 vetvy psychoakustických kóderov podpásmových. V roku 1990 sa Brandenburg stal odborným asistentom v Erlangene-Norimbergu. Počas svojho pôsobenia pokračoval v práci na kompresii hudby s vedcami z inštitútu Heinricha Herza Fraunhofer Society . V roku 1993 nastúpil do tímu Fraunhofer HHI. [42] Pieseň „ Tom's Diner “ od Suzanne Vega bola prvou piesňou, ktorú Karlheinz Brandenburg použil na vývoj formátu MP3. Brandenburg si skladbu osvojil na testovacie účely a počúval ju znova a znova zakaždým, keď zdokonalil schému, pričom sa uistil, že to nepriaznivo neovplyvní jemnosť Vega hlasu. [44] V súlade s tým nazval Vegu „matkou MP3“. [45]

Štandardizácia

V roku 1991 boli k dispozícii dva dostupné návrhy, ktoré boli posúdené pre zvukový štandard MPEG: MUSICAM ( Univerzálne integrované kódovanie pre podpásmové integrované kódovanie a Multiplexovanie prispôsobené M žiadanému vzoru ) a ASPEC ( adaptívne spektrálne percepčné kódovanie entropie ) . Technika MUSICAM, ktorú navrhli Philips (Holandsko), CCETT (Francúzsko), Inštitút pre technológiu vysielania (Nemecko) a Matsushita (Japonsko), [46]bol vybraný pre svoju jednoduchosť a chybovú robustnosť, ako aj pre vysokú úroveň výpočtovej účinnosti. [47] Formát MUSICAM založený na kódovaní podpásmov sa stal základom pre kompresný formát MPEG Audio, ktorý zahŕňal napríklad jeho rámcovú štruktúru, formát hlavičky, vzorkovacie frekvencie atď.

Zatiaľ čo veľká časť technológie a nápadov MUSICAM bola začlenená do definície MPEG Audio Layer I a Layer II, samotná banka filtrov a dátová štruktúra založená na rámovaní 1152 vzoriek (formát súboru a bajtovo orientovaný tok) MUSICAM zostali vo vrstve III ( MP3), ako súčasť výpočtovo neefektívnej banky hybridných filtrov . Pod predsedníctvom profesora Musmanna z Leibniz University Hannover bola úprava normy poverená Leon van de Kerkhof (Holandsko), Gerhard Stoll (Nemecko) a Yves-François Dehery (Francúzsko), ktorí pracovali na vrstve I a vrstve II. ASPEC bol spoločný návrh AT&T Bell Laboratories, Thomson Consumer Electronics, Fraunhofer Society a CNET . [48]Poskytoval najvyššiu efektivitu kódovania.

Pracovná skupina pozostávajúca z van de Kerkhof, Stoll, Leonardo Chiariglione ( VP CSELT pre médiá), Yves-François Dehery, Karlheinz Brandenburg (Nemecko) a James D. Johnston (Spojené štáty) prevzala nápady od ASPEC a integrovala banku filtrov z Layer II, pridali niektoré zo svojich vlastných nápadov, ako napríklad spoločné stereo kódovanie MUSICAM a vytvorili formát MP3, ktorý bol navrhnutý tak, aby dosahoval rovnakú kvalitu pri 128  kbit/s ako MP2 pri 192 kbit/s.

Algoritmy pre MPEG-1 Audio Layer I, II a III boli schválené v roku 1991 [13] [14] a dokončené v roku 1992 [15] ako súčasť MPEG-1 , prvého štandardného balíka MPEG , ktorého výsledkom bol medzinárodný štandard ISO / IEC 11172-3 (aka MPEG-1 Audio alebo MPEG-1 Part 3 ), publikovaná v roku 1993. [7] Súbory alebo dátové toky vyhovujúce tejto norme musia zvládať vzorkovacie frekvencie 48k, 44100 a 32k a musia byť naďalej podporované súčasnými MP3 prehrávačmi a dekodérmi. Prvá generácia MP3 teda definovala 14 × 3 = 42interpretácie dátových štruktúr MP3 rámcov a rozloženia veľkostí.

Ďalšie práce na zvuku MPEG [49] boli dokončené v roku 1994 ako súčasť druhej sady štandardov MPEG, MPEG-2 , formálnejšie známej ako medzinárodný štandard ISO/IEC 13818-3 (známy ako MPEG-2 Part 3 alebo spätne kompatibilný MPEG- 2 Audio alebo MPEG-2 Audio BC [16] ), pôvodne publikované v roku 1995. [8] [50]MPEG-2 Part 3 (ISO/IEC 13818-3) definoval 42 dodatočných bitových rýchlostí a vzorkovacích frekvencií pre MPEG-1 Audio Layer I, II a III. Nové vzorkovacie frekvencie sú presne polovičné oproti pôvodne definovaným v MPEG-1 Audio. Toto zníženie vzorkovacej frekvencie slúži na zníženie dostupnej frekvenčnej vernosti na polovicu a zároveň zníženie bitovej rýchlosti o 50 %. MPEG-2 Part 3 tiež vylepšil zvuk MPEG-1 tým, že umožňuje kódovanie zvukových programov s viac ako dvoma kanálmi, až do 5.1 multikanálových. [49] Formát MP3 kódovaný pomocou MPEG-2 má za následok reprodukciu polovičnej šírky pásma oproti MPEG-1 vhodnej pre klavír a spev.

Tretia generácia dátových tokov (súborov) v štýle „MP3“ rozšírila myšlienky a implementáciu MPEG-2 , ale dostala názov MPEG-2.5audio, keďže MPEG-3 už mal iný význam. Toto rozšírenie bolo vyvinuté vo Fraunhofer IIS, registrovaných držiteľoch patentov na MP3, znížením synchronizačného poľa snímky v hlavičke MP3 z 12 na 11 bitov. Rovnako ako pri prechode z MPEG-1 na MPEG-2, MPEG-2.5 pridáva ďalšie vzorkovacie frekvencie presne polovičné v porovnaní s dostupnými pri použití MPEG-2. Rozširuje tak rozsah MP3 tak, aby zahŕňal ľudskú reč a ďalšie aplikácie, ale vyžaduje len 25 % šírky pásma (reprodukcia frekvencie) možnej pomocou vzorkovacej frekvencie MPEG-1. Hoci to nie je norma uznávaná ISO, MPEG-2.5 je široko podporovaný lacnými čínskymi a značkovými digitálnymi audio prehrávačmi, ako aj počítačovými softvérovými MP3 kódovačmi ( LAME ), dekodérmi (FFmpeg) a prehrávačmi (MPC) s pridaním 3 × 8 = 24ďalšie typy snímok MP3. Každá generácia MP3 teda podporuje 3 vzorkovacie frekvencie presne polovičné oproti predchádzajúcej generácii pre celkovo 9 druhov súborov vo formáte MP3. Tabuľka porovnávania vzorkovacej frekvencie medzi MPEG-1, 2 a 2.5 je uvedená ďalej v článku. [51] [52] MPEG-2.5 podporujú LAME (od roku 2000), Media Player Classic (MPC), iTunes a FFmpeg.

MPEG-2.5 nebol vyvinutý spoločnosťou MPEG (pozri vyššie) a nikdy nebol schválený ako medzinárodný štandard. MPEG-2.5 je teda neoficiálne alebo proprietárne rozšírenie formátu MP3. Napriek tomu je všadeprítomný a obzvlášť výhodný pre aplikácie ľudskej reči s nízkou bitovou rýchlosťou.

Verzie MPEG Audio Layer III [7] [8] [14] [51] [52] [53]
Verzia Medzinárodná norma [*] Dátum vydania prvého vydania Dátum zverejnenia posledného vydania
MPEG-1 Audio Layer III ISO/IEC 11172-3 (MPEG-1 časť 3) 1993
MPEG-2 Audio Layer III ISO/IEC 13818-3 (MPEG-2 časť 3) 1995 1998
MPEG-2.5 Audio Layer III neštandardné, vlastnícke 2000 2008

  • Norma ISO ISO/IEC 11172-3 (aka MPEG-1 Audio) definovala tri formáty: MPEG-1 Audio Layer I, Layer II a Layer III. Norma ISO ISO/IEC 13818-3 (aka MPEG-2 Audio) definuje rozšírenú verziu zvuku MPEG-1: MPEG-2 Audio Layer I, Layer II a Layer III. Zvuk MPEG-2 (MPEG-2 časť 3) by sa nemal zamieňať s MPEG-2 AAC (MPEG-2 časť 7 – ISO/IEC 13818-7). [16]

Účinnosť kompresie kódovačov je zvyčajne definovaná bitovou rýchlosťou, pretože kompresný pomer závisí od bitovej hĺbky a vzorkovacej frekvencie vstupného signálu. Napriek tomu sú kompresné pomery často publikované. Môžu používať parametre kompaktného disku (CD) ako referencie (44,1 kHz , 2 kanály pri 16 bitoch na kanál alebo 2 × 16 bitov), ​​alebo niekedy parametre SP (DAT) Digital Audio Tape (48 kHz, 2 × 16 bitov). . Kompresné pomery s týmto posledným odkazom sú vyššie, čo demonštruje problém s použitím termínu kompresný pomer pre stratové snímače.

Karlheinz Brandenburg použil CD nahrávku piesne Suzanne VegaTom's Diner “ na posúdenie a zdokonalenie kompresného algoritmu MP3 . Táto skladba bola vybraná kvôli jej takmer monofónnej povahe a širokému spektrálnemu obsahu, vďaka čomu je počas prehrávania ľahšie počuť nedokonalosti kompresného formátu. Táto konkrétna stopa má zaujímavú vlastnosť v tom, že dva kanály sú takmer, ale nie úplne rovnaké, čo vedie k prípadu, keď Binaurálna maskovacia úroveň zníženia spôsobuje priestorové odmaskovanie artefaktov hluku, pokiaľ kodér správne nerozpozná situáciu a nepoužije korekcie podobné tým. podrobne opísaný v psychoakustickom modeli MPEG-2 AAC. Niektoré kritickejšie zvukové úryvky ( zvonkohra ,trojuholník , akordeón , atď.) boli prevzaté z referenčného kompaktného disku EBU V3/SQAM a boli použité profesionálnymi zvukovými inžiniermi na posúdenie subjektívnej kvality formátov MPEG Audio. LAME je najpokročilejší kódovač MP3. [ citácia ] LAME obsahuje kódovanie s variabilnou bitovou rýchlosťou VBR, ktoré používa namiesto cieľovej bitovej rýchlosti parameter kvality. Neskoršie verzie (2008+) podporujú cieľ kvality n.nnn, ktorý automaticky vyberá vzorkovacie frekvencie MPEG-2 alebo MPEG-2.5 ako vhodné pre nahrávky ľudskej reči, ktoré potrebujú iba rozlíšenie šírky pásma 5512 Hz.

Vstup na verejnosť

Implementácia referenčného simulačného softvéru, napísaná v jazyku C a neskôr známa ako ISO 11172-5 , bola vyvinutá (v rokoch 1991–1996) členmi výboru ISO MPEG Audio s cieľom produkovať bitovo vyhovujúce MPEG zvukové súbory (vrstva 1, Vrstva 2, Vrstva 3). Bol schválený ako návrh technickej správy ISO/IEC v marci 1994 a vytlačený ako dokument CD 11172-5 v apríli 1994. [54] Bol schválený ako návrh technickej správy (DTR/DIS) v novembri 1994, [55 ] dokončená v roku 1996 a publikovaná ako medzinárodná norma ISO/IEC TR 11172-5:1998 v roku 1998. [56] Referenčný softvér v jazyku C bol neskôr publikovaný ako voľne dostupná norma ISO. [57]Vďaka práci v inom ako reálnom čase na mnohých operačných systémoch dokázala demonštrovať prvé hardvérové ​​dekódovanie v reálnom čase ( založené na DSP ) komprimovaného zvuku. Niektoré ďalšie implementácie MPEG Audio kodérov a dekodérov v reálnom čase [58] boli dostupné na účely digitálneho vysielania (rozhlasové DAB , televízne DVB ) smerom k spotrebiteľským prijímačom a set top boxom.

Fraunhofer Society vydala 7. júla 1994 prvý softvérový kódovač MP3 s názvom l3enc . [59] Príponu súboru .mp3 zvolil tím Fraunhofer 14. júla 1995 (predtým sa súbory nazývali .bit ). [1] S prvým softvérovým MP3 prehrávačom v reálnom čase WinPlay3 (vydaný 9. septembra 1995) bolo veľa ľudí schopných kódovať a prehrávať súbory MP3 na svojich počítačoch. Kvôli relatívne malým pevným diskom tej doby (≈500–1000 MB ) bola stratová kompresia nevyhnutná na uloženie hudby v hodnote viacerých albumov na domácom počítači ako úplných nahrávok (na rozdiel od MIDInotácie alebo sledovacie súbory, ktoré kombinujú notáciu s krátkymi nahrávkami nástrojov hrajúcich jednotlivé noty).

Fraunhoferov príklad implementácie

Hacker menom SoloH objavil zdrojový kód referenčnej implementácie MPEG „dist10“ krátko po vydaní na serveroch univerzity v Erlangene . Vyvinul kvalitnejšiu verziu a šíril ju na internete. Tento kód odštartoval rozšírené kopírovanie CD a distribúciu digitálnej hudby ako MP3 cez internet. [60] [61] [62] [63]

Internetová distribúcia

V druhej polovici 90. rokov sa súbory MP3 začali šíriť na internete , často prostredníctvom podzemných sietí pirátskych piesní. Prvý známy experiment v internetovej distribúcii zorganizoval začiatkom 90. rokov Internet Underground Music Archive , známejší pod skratkou IUMA. Po niekoľkých experimentoch [64] s použitím nekomprimovaných zvukových súborov tento archív začal dodávať na natívnom celosvetovom nízkorýchlostnom internete niektoré komprimované zvukové súbory MPEG vo formáte MP2 (Layer II) a neskôr aj použité súbory MP3, keď bol štandard úplne dokončený. Popularita MP3 začala rýchlo stúpať s príchodom zvukového prehrávača Winamp od spoločnosti Nullsoft, vydaný v roku 1997. V roku 1998 bol uvedený na trh prvý prenosný polovodičový digitálny audio prehrávač MPMan vyvinutý spoločnosťou SaeHan Information Systems so sídlom v Soule v Južnej Kórei a Rio PMP300 bol následne predaný v roku 1998, napriek snahám o potlačenie práv zo strany spoločnosti RIAA . _ [65]

V novembri 1997 ponúkal web mp3.com tisíce MP3 vytvorených nezávislými umelcami zadarmo. [65] Malá veľkosť súborov MP3 umožnila rozšírené zdieľanie súborov peer-to-peer s hudbou stiahnutou z CD, čo by predtým bolo takmer nemožné. Prvá veľká sieť na zdieľanie súborov typu peer-to-peer, Napster , bola spustená v roku 1999. Jednoduchosť vytvárania a zdieľania súborov MP3 viedla k rozsiahlemu porušovaniu autorských práv . Veľké nahrávacie spoločnosti tvrdili, že toto bezplatné zdieľanie hudby znížilo predaj a nazvali to „ hudobné pirátstvo “. Reagovali tým, že začali súdne spory proti Napsteru, ktorý bol nakoniec vypnutý a neskôr predaný, a proti jednotlivým používateľom, ktorí sa zaoberali zdieľaním súborov. [66]

Neautorizované zdieľanie súborov MP3 pokračuje v sieťach peer-to-peer ďalšej generácie . Niektoré autorizované služby, ako napríklad Beatport , Bleep , Juno Records , eMusic , Zune Marketplace , Walmart.com , Rhapsody , nahrávací priemysel schválil reinkarnáciu Napsteru a Amazon.com predávajú neobmedzenú hudbu vo formáte MP3.

Dizajn

Štruktúra súboru

Schéma štruktúry súboru MP3
Schéma štruktúry súboru MP3 (MPEG verzia 2.5 nie je podporovaná, preto 12 namiesto 11 bitov pre MP3 Sync Word).

MP3 súbor sa skladá z MP3 snímok, ktoré pozostávajú z hlavičky a dátového bloku. Táto sekvencia rámcov sa nazýva elementárny prúd . Kvôli „zásobníku bitov“ nie sú rámce nezávislými položkami a zvyčajne ich nemožno extrahovať na ľubovoľných hraniciach rámca. Dátové bloky MP3 obsahujú (komprimované) zvukové informácie z hľadiska frekvencií a amplitúd. Diagram ukazuje, že hlavička MP3 pozostáva zo synchronizačného slova , ktoré sa používa na identifikáciu začiatku platného rámca. Potom nasleduje bit označujúci, že ide o štandard MPEG a dva bity, ktoré označujú, že sa používa vrstva 3; teda MPEG-1 Audio Layer 3 alebo MP3. Potom sa hodnoty budú líšiť v závislosti od súboru MP3. ISO / IEC 11172-3definuje rozsah hodnôt pre každú časť hlavičky spolu so špecifikáciou hlavičky. Väčšina súborov MP3 dnes obsahuje metadáta ID3 , ktoré predchádzajú alebo nasledujú za rámcami MP3, ako je uvedené v diagrame. Dátový tok môže obsahovať voliteľný kontrolný súčet.

Spoločné stereo sa robí iba na základe jednotlivých snímok. [67]

Kódovanie a dekódovanie

Algoritmus kódovania MP3 je vo všeobecnosti rozdelený na štyri časti. Časť 1 rozdeľuje zvukový signál na menšie časti, nazývané snímky, a na výstupe sa potom vykoná modifikovaný filter diskrétnej kosínusovej transformácie (MDCT). Časť 2 prechádza vzorkou do 1024-bodovej rýchlej Fourierovej transformácie (FFT), potom sa aplikuje psychoakustický model a na výstupe sa vykoná ďalší MDCT filter. Časť 3 kvantifikuje a kóduje každú vzorku, známu ako pridelenie šumu, ktorá sa sama prispôsobuje, aby spĺňala požiadavky na bitovú rýchlosť a maskovanie zvuku . Časť 4 formátuje bitový tok nazývaný zvukový rámec, ktorý sa skladá zo 4 častí, hlavičky , kontroly chýb, audio dáta a pomocné dáta . [33]

Štandard MPEG-1 neobsahuje presnú špecifikáciu pre kódovač MP3, ale poskytuje príklady psychoakustických modelov, rýchlostnej slučky a podobne v nenormatívnej časti pôvodného štandardu. [68] MPEG-2 zdvojnásobuje počet podporovaných vzorkovacích frekvencií a MPEG-2.5 pridáva 3 ďalšie. Keď to bolo napísané, navrhované implementácie boli dosť staré. Implementátori štandardu mali navrhnúť vlastné algoritmy vhodné na odstránenie časti informácií zo zvukového vstupu. Výsledkom bolo, že sa sprístupnilo mnoho rôznych kódovačov MP3, z ktorých každý vytváral súbory rôznej kvality. Porovnania boli široko dostupné, takže pre potenciálneho používateľa kodéra bolo ľahké nájsť najlepšiu voľbu. Niektoré kódovače, ktoré boli zdatné v kódovaní pri vyšších bitových rýchlostiach (napríklad LAME) neboli nevyhnutne také dobré pri nižších bitových rýchlostiach. Postupom času sa LAME vyvíjal na webovej stránke SourceForge, až sa z neho stal de facto CBR MP3 kodér. Neskôr bol pridaný režim ABR. Práca pokročila na skutočne premenlivej bitovej rýchlosti s cieľom kvality medzi 0 a 10. Nakoniec čísla (ako -V 9,600) mohli vytvoriť vynikajúcu kvalitu kódovania hlasu s nízkou bitovou rýchlosťou iba 41 kbit/s pomocou rozšírení MPEG-2.5.

Počas kódovania sa odoberie 576 vzoriek v časovej oblasti, ktoré sa transformujú na 576 vzoriek vo frekvenčnej oblasti . [ potrebné vysvetlenie ] Ak dôjde k prechodnému javu , odoberie sa 192 vzoriek namiesto 576. Toto sa robí s cieľom obmedziť dočasné šírenie kvantizačného šumu sprevádzajúceho prechodný jav (pozri psychoakustika ). Rozlíšenie frekvencie je obmedzené malou veľkosťou okna dlhého bloku, čo znižuje účinnosť kódovania. [67] Časové rozlíšenie môže byť príliš nízke pre vysoko prechodné signály a môže spôsobiť rozmazanie perkusívnych zvukov. [67]

Kvôli stromovej štruktúre filtračnej skupiny sa problémy s pre-echo zhoršujú, pretože kombinovaná impulzná odozva dvoch filtračných skupín neposkytuje a ani nemôže poskytnúť optimálne riešenie v časovom/frekvenčnom rozlíšení. [67] Okrem toho kombinácia výstupov dvoch filtračných bánk vytvára problémy s aliasingom, ktoré sa musia čiastočne riešiť vo fáze "kompenzácie aliasingu"; to však vytvára prebytočnú energiu, ktorá sa má kódovať vo frekvenčnej doméne, čím sa znižuje účinnosť kódovania. [69]

Na druhej strane dekódovanie je v norme starostlivo definované. Väčšina dekodérov je „ kompatibilná s bitovým tokom “, čo znamená, že dekomprimovaný výstup, ktorý vytvárajú z daného súboru MP3, bude rovnaký, v rámci špecifikovaného stupňa tolerancie zaokrúhľovania , ako výstup špecifikovaný matematicky v dokumente vysokého štandardu ISO/IEC (ISO /IEC 11172-3). Preto je porovnanie dekodérov zvyčajne založené na tom, ako sú výpočtovo efektívne (tj koľko pamäte alebo času CPU využívajú v procese dekódovania). Postupom času sa tento problém stal menším problémom ako frekvencia hodín CPUprešli z MHz na GHz. Celkové oneskorenie kódovača/dekodéra nie je definované, čo znamená, že neexistuje žiadne oficiálne ustanovenie pre prehrávanie bez medzier . Niektoré kódovače, ako napríklad LAME, však môžu pripojiť ďalšie metaúdaje, ktoré umožnia hráčom, ktorí ich zvládnu, zabezpečiť bezproblémové prehrávanie.

kvalita

Pri stratovom kódovaní zvuku, ako je vytváranie dátového toku MP3, existuje kompromis medzi množstvom generovaných dát a kvalitou zvuku výsledkov. Osoba, ktorá generuje MP3, vyberie bitovú rýchlosť , ktorá špecifikuje, koľko kilobitov za sekundu zvuku sa požaduje. Čím vyššia je bitová rýchlosť, tým väčší bude dátový tok MP3 a vo všeobecnosti bude znieť bližšie k pôvodnej nahrávke. Pri príliš nízkej bitovej rýchlosti môžu byť v reprodukcii počuteľné kompresné artefakty (tj zvuky, ktoré neboli prítomné v pôvodnej nahrávke). Niektoré zvuky je ťažké komprimovať kvôli ich náhodnosti a ostrým útokom. Keď je tento typ zvuku komprimovaný, dochádza k artefaktom, ako je zvonenie alebo pre-echosú zvyčajne počuť. Vzorka potlesku alebo trojuholníkový nástroj s relatívne nízkou bitovou rýchlosťou poskytujú dobré príklady kompresných artefaktov. Väčšina subjektívnych testov percepčných kodekov má tendenciu vyhýbať sa používaniu týchto typov zvukových materiálov, avšak artefakty generované perkusívnymi zvukmi sú sotva postrehnuteľné kvôli špecifickej funkcii dočasného maskovania 32 podpásmovej filtračnej banky vrstvy II, na ktorej je formát založený. .

Okrem bitovej rýchlosti zakódovaného zvuku závisí kvalita zvuku zakódovaného vo formáte MP3 aj od kvality algoritmu kódovania, ako aj od zložitosti kódovaného signálu. Keďže štandard MP3 poskytuje pri kódovacích algoritmoch značnú voľnosť, rôzne kódovače majú úplne odlišnú kvalitu, dokonca aj pri rovnakých bitových rýchlostiach. Napríklad vo verejnom teste počúvania s dvoma skoršími MP3 kódovačmi nastavenými na približne 128 kbit/s [70] jeden získal 3,66 na stupnici 1–5, zatiaľ čo druhý len 2,22. Kvalita závisí od výberu kódovača a parametrov kódovania. [71]

Toto pozorovanie spôsobilo revolúciu v kódovaní zvuku. Prvotná a jediná úvaha bola skorá bitová rýchlosť. V tom čase boli súbory MP3 najjednoduchšieho typu: používali rovnakú bitovú rýchlosť pre celý súbor: tento proces je známy ako kódovanie konštantnej bitovej rýchlosti (CBR). Použitím konštantnej bitovej rýchlosti je kódovanie jednoduchšie a menej náročné na CPU. Je však tiež možné optimalizovať veľkosť súboru vytvorením súborov, kde sa bitová rýchlosť mení v celom súbore. Tieto sú známe ako variabilná bitová rýchlosť. Zásobník bitov a kódovanie VBR boli vlastne súčasťou pôvodného štandardu MPEG-1. Ich koncepcia spočíva v tom, že v akomkoľvek zvukovom zázname sa niektoré časti ľahšie komprimujú, ako napríklad ticho alebo hudba obsahujúca len niekoľko tónov, zatiaľ čo iné sa komprimujú ťažšie. Celková kvalita súboru sa teda môže zvýšiť použitím nižšej bitovej rýchlosti pre menej zložité pasáže a vyššej pre zložitejšie časti. Pri niektorých pokročilých MP3 kodéroch je možné špecifikovať danú kvalitu a kodér podľa toho upraví bitovú rýchlosť. Používatelia, ktorí si želajú konkrétne „nastavenie kvality“, ktoré je transparentnéich uši môžu použiť túto hodnotu pri kódovaní všetkej svojej hudby a vo všeobecnosti sa nemusia obávať vykonania osobných testov počúvania každej skladby na určenie správnej bitovej rýchlosti.

Vnímanú kvalitu môže ovplyvniť prostredie počúvania (okolitý hluk), pozornosť poslucháča a tréning poslucháča a vo väčšine prípadov aj zvukové vybavenie poslucháča (ako sú zvukové karty, reproduktory a slúchadlá). Okrem toho je možné dosiahnuť dostatočnú kvalitu nastavením nižšej kvality pre prednášky a aplikácie ľudskej reči a znížiť čas a zložitosť kódovania. Test, ktorý dal novým študentom profesor hudby zo Stanfordskej univerzity Jonathan Berger, ukázal, že preferencia študentov pre hudbu v kvalite MP3 každým rokom stúpa. Berger povedal, že študenti uprednostňujú „šuchotavé“ zvuky, ktoré do hudby prinášajú MP3. [72]

Hĺbková štúdia kvality zvuku MP3, projekt zvukového umelca a skladateľa Ryana Maguirea „The Ghost in the MP3“ izoluje zvuky stratené počas kompresie MP3. V roku 2015 vydal skladbu „moDernisT“ (anagram „Tom's Diner“), zloženú výlučne zo zvukov odstránených počas kompresie MP3 piesne „Tom's Diner“, [73] [74] [75] pôvodne použitá skladba vo formulácii štandardu MP3. Podrobný popis techník používaných na izoláciu zvukov odstránených počas kompresie MP3 spolu s koncepčnou motiváciou projektu bol uverejnený v zborníku 2014 International Computer Music Conference. [76]

Bitová rýchlosť

Dostupné bitové rýchlosti MPEG Audio Layer III
(kbit/s) [14] [51] [52] [53] [77]
MPEG-1
Audio Layer III
MPEG-2
Audio Layer III
MPEG-2.5
Audio Layer III
8 8
16 16
24 24
32 32 32
40 40 40
48 48 48
56 56 56
64 64 64
80 80
96 96
112 112
128 128
n/a 144
160 160
192
224
256
320
Podporované vzorkovacie frekvencie
podľa formátu MPEG Audio [14] [51] [52] [53]
MPEG-1
Audio Layer III
MPEG-2
Audio Layer III
MPEG-2.5
Audio Layer III
8000 Hz
11025 Hz
12 000 Hz
16000 Hz
22050 Hz
24 000 Hz
32 000 Hz
44100 Hz
48 000 Hz

Bitová rýchlosť je súčinom vzorkovacej frekvencie a počtu bitov na vzorku použitých na kódovanie hudby. Audio CD je 44 100 vzoriek za sekundu. Počet bitov na vzorku závisí aj od počtu audio kanálov. CD je stereo a 16 bitov na kanál. Takže vynásobením 44100 číslom 32 dostaneme 1411200 – bitovú rýchlosť nekomprimovaného digitálneho zvuku CD. MP3 bol navrhnutý tak, aby zakódoval tieto 1411 kbit/s dáta rýchlosťou 320 kbit/s alebo menej. Keďže algoritmy MP3 detegujú menej zložité pasáže, môžu sa použiť nižšie bitové rýchlosti. Pri použití MPEG-2 namiesto MPEG-1 podporuje MP3 iba nižšie vzorkovacie frekvencie (16 000, 22 050 alebo 24 000 vzoriek za sekundu) a ponúka možnosti bitovej rýchlosti len 8 kbit/s, ale nie vyššiu ako 160 kbit/s. Znížením vzorkovacej frekvencie MPEG-2 vrstva III odstráni všetky frekvencie nad polovicou novej vzorkovacej frekvencie, ktorá mohla byť prítomná v zdrojovom zvuku.

Ako je uvedené v týchto dvoch tabuľkách, v štandarde MPEG-1 Audio Layer III je povolených 14 vybraných bitových rýchlostí : 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 a 320 kbit /s, spolu s 3 najvyššími dostupnými vzorkovacími frekvenciami 32, 44,1 a 48  kHz . [52] MPEG-2 Audio Layer III tiež umožňuje 14 trochu odlišných (a väčšinou nižších) bitových rýchlostí 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144, 160 kbit /s so vzorkovacími frekvenciami 16, 22,05 a 24  kHz , ktoré sú presne polovičné oproti MPEG-1. [52] Snímky MPEG-2.5 Audio Layer III sú obmedzené iba na 8 bitových rýchlostí8, 16, 24, 32, 40, 48, 56 a 64 kbit/s s 3 ešte nižšími vzorkovacími frekvenciami 8, 11,025 a 12 kHz. [ citácia ] Na starších systémoch, ktoré podporujú iba štandard MPEG-1 Audio Layer III, sa súbory MP3 s bitovou rýchlosťou nižšou ako 32 kbit/s mohli prehrávať zrýchlene a naklonené.

Starším systémom tiež chýbajú ovládacie prvky prehrávania v MP3 rýchlo dopredu a dozadu. [78] [79]

Snímky MPEG-1 obsahujú najviac detailov v režime 320 kbit/s, najvyššom povolenom nastavení bitovej rýchlosti, [80] s tichom a jednoduchými tónmi, ktoré stále vyžadujú 32 kbit/s. Snímky MPEG-2 dokážu zachytiť reprodukciu zvuku až do 12 kHz, ktorá je potrebná až do rýchlosti 160 kbit/s. Súbory MP3 vytvorené pomocou MPEG-2 nemajú šírku pásma 20 kHz kvôli Nyquist-Shannonovmu vzorkovaciemu teorému . Reprodukcia frekvencie je vždy striktne nižšia ako polovica vzorkovacej frekvencie a nedokonalé filtre vyžadujú väčšiu mieru chyby (úroveň šumu verzus ostrosť filtra), takže vzorkovacia frekvencia 8 kHz obmedzuje maximálnu frekvenciu na 4 kHz, zatiaľ čo vzorkovacia frekvencia 48 kHz rýchlosť obmedzuje reprodukciu zvuku MP3 na maximálne 24 kHz. MPEG-2 využíva polovicu a MPEG-2.5 iba štvrtinu vzorkovacej frekvencie MPEG-1.

Pre všeobecnú oblasť reprodukcie ľudskej reči je šírka pásma 5512 Hz dostatočná na dosiahnutie vynikajúcich výsledkov (pre hlas) s použitím vzorkovacej frekvencie 11025 a kódovania VBR zo súboru WAV 44100 (štandard). Anglicky hovoriaci priemerne 41–42 kbit/s s nastavením -V 9,6, ale to sa môže líšiť v závislosti od množstva zaznamenaného ticha alebo rýchlosti doručenia (wpm). Prevzorkovanie na 12000 (šírka pásma 6K) sa volí parametrom LAME -V 9.4. Podobne -V 9.2 vyberá vzorkovaciu frekvenciu 16 000 a výsledné 8K dolnopriepustné filtrovanie. Pre viac informácií pozri Nyquist – Shannon. Staršie verzie LAME a FFmpeg podporujú iba celočíselné argumenty pre parameter výberu kvality s premenlivou bitovou rýchlosťou. Parameter kvality n.nnn (-V) je zdokumentovaný na lame.sourceforge.net, ale je podporovaný iba v LAME s novým štýlom VBR s variabilným výberom kvality bitovej rýchlosti – nie priemernej bitovej rýchlosti (ABR).

Vzorkovacia frekvencia 44,1 kHz sa bežne používa na reprodukciu hudby, pretože sa používa aj pre audio CD , hlavný zdroj používaný na vytváranie súborov MP3. Na internete sa používa veľké množstvo bitových rýchlostí. Bežne sa používa prenosová rýchlosť 128 kbit/s, [81] pri kompresnom pomere 11:1 ponúka adekvátnu kvalitu zvuku na relatívne malom priestore. S rastúcou dostupnosťou šírky pásma internetu a veľkosťou pevných diskov sú rozšírené vyššie bitové rýchlosti až do 320 kbit/s. Nekomprimovaný zvuk uložený na zvukovom disku CD má bitovú rýchlosť 1 411,2 kbit/s (16 bitov/vzorka × 44 100 vzoriek/sekundu × 2 kanály / 1 000 bitov/kilobit), takže bitové rýchlosti 128, 160 a 192 kbit/s predstavujú kompresné pomery približne 11:1, 9:1 a 7:1.

Neštandardné bitové rýchlosti až do 640 kbit/s je možné dosiahnuť pomocou kodéra LAME a možnosti voľného formátu, hoci tieto súbory dokáže prehrať len málo prehrávačov MP3. Podľa normy ISO sa od dekodérov vyžaduje len schopnosť dekódovať toky do 320 kbit/s. [82] [83] [84] Prvé kódovače MPEG Layer III používali to, čo sa dnes nazýva konštantná bitová rýchlosť (CBR). Softvér bol schopný použiť iba jednotnú bitovú rýchlosť pre všetky snímky v súbore MP3. Neskoršie sofistikovanejšie kódovače MP3 boli schopné použiť zásobník bitov na zacielenie na priemernú bitovú rýchlosť , pričom vybrali rýchlosť kódovania pre každý snímok na základe zložitosti zvuku v danej časti nahrávky.

Sofistikovanejší MP3 kodér môže produkovať zvuk s premenlivou bitovou rýchlosťou . Zvuk MPEG môže používať prepínanie bitovej rýchlosti na základe jednotlivých snímok, ale musia to podporovať iba dekodéry vrstvy III. [52] [85] [86] [87] VBR sa používa, keď je cieľom dosiahnuť pevnú úroveň kvality. Konečná veľkosť súboru kódovania VBR je menej predvídateľná ako pri konštantnej bitovej rýchlosti . Priemerná bitová rýchlosťje typ VBR implementovaný ako kompromis medzi týmito dvoma: bitová rýchlosť sa môže meniť pre konzistentnejšiu kvalitu, ale je riadená tak, aby zostala blízko priemernej hodnoty zvolenej používateľom pre predvídateľné veľkosti súborov. Hoci dekodér MP3 musí podporovať VBR, aby bol v súlade so štandardmi, historicky niektoré dekodéry majú chyby s dekódovaním VBR, najmä predtým, ako sa kodéry VBR rozšírili. Najvyvinutejší LAME MP3 kodér podporuje generáciu VBR, ABR a dokonca aj staršie CBR MP3 formáty.

Zvuk vrstvy III môže tiež využívať „bitový zásobník“, schopnosť čiastočne plného rámca podržať časť zvukových dát nasledujúceho rámca, čo umožňuje dočasné zmeny efektívnej bitovej rýchlosti, dokonca aj pri konštantnom dátovom toku. [52] [85] Vnútorná manipulácia so zásobníkom bitov zvyšuje oneskorenie kódovania. Pre frekvencie nad približne 16 kHz neexistuje žiadne pásmo mierkového faktora 21 (sfb21)  , čo núti kódovač vybrať si medzi menej presnou reprezentáciou v pásme 21 alebo menej efektívnym ukladaním vo všetkých pásmach pod pásmom 21, čo má za následok plytvanie dátovým tokom v kódovaní VBR. [88]

Doplnkové údaje

Pole doplnkových údajov sa môže použiť na uloženie údajov definovaných používateľom. Doplnkové údaje sú voliteľné a počet dostupných bitov nie je explicitne uvedený. Doplnkové dáta sú umiestnené za bitmi Huffmanovho kódu a siahajú tam, kde ukazuje main_data_begin nasledujúceho rámca. Encoder mp3PRO použil pomocné dáta na zakódovanie dodatočných informácií, ktoré by mohli zlepšiť kvalitu zvuku pri dekódovaní pomocou vlastného algoritmu.

Metadáta

„Štítok“ v zvukovom súbore je časť súboru, ktorá obsahuje metadáta , ako je názov, interpret, album, číslo skladby alebo iné informácie o obsahu súboru. Štandardy MP3 nedefinujú formáty značiek pre súbory MP3, ani neexistuje štandardný formát kontajnera , ktorý by podporoval metadáta a eliminoval potrebu značiek. Existuje však niekoľko de facto štandardov pre formáty značiek. Od roku 2010 sú najrozšírenejšie ID3v1 a ID3v2 a nedávno predstavené APEv2 . Tieto značky sú zvyčajne vložené na začiatok alebo koniec súborov MP3, oddelene od skutočných údajov snímok MP3. MP3 dekodéry buď extrahujú informácie z tagov, alebo s nimi zaobchádzajú ako s ignorovateľnými dátami, ktoré nie sú MP3.

Softvér na prehrávanie a úpravu často obsahuje funkcie na úpravu značiek, existujú však aj aplikácie na úpravu značiek určené na tento účel. Okrem metadát týkajúcich sa zvukového obsahu možno pre DRM použiť aj značky . [89] ReplayGain je štandard na meranie a ukladanie hlasitosti súboru MP3 ( normalizácia zvuku ) v jeho tagu metadát, ktorý umožňuje prehrávaču kompatibilnému s ReplayGain automaticky upraviť celkovú hlasitosť prehrávania pre každý súbor. MP3Gain možno použiť na reverzibilnú úpravu súborov na základe meraní ReplayGain tak, aby bolo možné dosiahnuť upravené prehrávanie na prehrávačoch bez schopnosti ReplayGain.

Licencie, vlastníctvo a legislatíva

Základná technológia dekódovania a kódovania MP3 je v Európskej únii bez patentu, platnosť všetkých patentov tam vyprší najneskôr v roku 2012. V Spojených štátoch sa technológia stala v podstate bez patentu 16. apríla 2017 (pozri nižšie). Platnosť patentov na MP3 vypršala v USA medzi rokmi 2007 a 2017. V minulosti si mnohé organizácie nárokovali vlastníctvo patentov súvisiacich s dekódovaním alebo kódovaním MP3. Tieto tvrdenia viedli k množstvu právnych hrozieb a konaní z rôznych zdrojov. V dôsledku toho bola neistota o tom, ktoré patenty musia byť licencované, aby bolo možné vytvárať produkty MP3 bez porušenia patentu v krajinách, ktoré povoľujú softvérové ​​patenty , bola bežnou črtou skorých štádií prijatia technológie.

Pôvodný takmer úplný štandard MPEG-1 (časti 1, 2 a 3) bol verejne dostupný 6. decembra 1991 ako ISO CD 11172. [90] [91] Vo väčšine krajín nemožno patenty podávať po zverejnení doterajšieho stavu techniky. a patenty vypršia 20 rokov po prvom dátume podania, čo môže byť až o 12 mesiacov neskôr v prípade prihlášok v iných krajinách. V dôsledku toho platnosť patentov potrebných na implementáciu MP3 vo väčšine krajín vypršala do decembra 2012, 21 rokov po zverejnení ISO CD 11172.

Výnimkou sú Spojené štáty americké, kde platné patenty, ktoré boli podané pred 8. júnom 1995, vypršia po 17 rokoch od dátumu vydania alebo po 20 rokoch od dátumu priority. Zdĺhavý proces patentového stíhania môže viesť k vydaniu patentu oveľa neskôr, ako sa bežne očakáva (pozri patenty na ponorky ). Platnosť rôznych patentov súvisiacich s MP3 v Spojených štátoch vypršala v rokoch 2007 až 2017. [92] Patenty na čokoľvek zverejnené v ISO CD 11172 podané rok alebo viac po jeho zverejnení sú sporné. Ak sa vezmú do úvahy iba známe patenty na MP3 podané do decembra 1992, potom je dekódovanie MP3 v USA bez patentu od 22. septembra 2015, kedy vypršala platnosť patentu USA 5 812 672 , ktorý mal PCT prihlášku v októbri 1992. [93] [94][95] Ak sa za meradlo berie najdlhšie platný patent uvedený vo vyššie uvedených odkazoch, potom sa technológia MP3 stala v Spojených štátoch bez patentu 16. apríla 2017, keď bol patent USA 6 009 399 držaný [96] a spravovaný spoločnosťou Technicolor . , [97] uplynula. Výsledkom je, že mnoho bezplatných a otvorených softvérových projektov, ako napríklad operačný systém Fedora , sa rozhodlo začať štandardne dodávať podporu MP3 a používatelia sa už nebudú musieť uchyľovať k inštalácii neoficiálnych balíkov spravovaných softvérovými úložiskami pre MP3 tretích strán. prehrávanie alebo kódovanie. [98]

Spoločnosť Technicolor (predtým nazývaná Thomson Consumer Electronics) tvrdila, že riadi licencovanie MP3 patentov vrstvy 3 v mnohých krajinách vrátane Spojených štátov, Japonska, Kanady a krajín EÚ. [99] Technicolor aktívne presadzoval tieto patenty. [100] Príjmy z MP3 licencií od správy Technicolor vygenerovali Fraunhofer Society v roku 2005 približne 100 miliónov EUR. [101]V septembri 1998 Fraunhoferov inštitút poslal list niekoľkým vývojárom MP3 softvéru, v ktorom uviedol, že na „distribúciu a/alebo predaj dekodérov a/alebo kodérov je potrebná licencia“. V liste sa tvrdilo, že nelicencované produkty "porušujú patentové práva spoločností Fraunhofer a Thomson. Ak chcete vyrábať, predávať alebo distribuovať produkty využívajúce štandard [MPEG Layer-3] a tým aj naše patenty, musíte od nás získať licenciu na tieto patenty." [102] To viedlo k situácii, keď projekt LAME MP3 encoder nemohol svojim používateľom ponúknuť oficiálne binárne súbory, ktoré by mohli bežať na ich počítači. Pozícia projektu bola, že ako zdrojový kód bol LAME jednoducho popis toho, ako by mohol kódovač MP3implementovať. Neoficiálne boli kompilované binárne súbory dostupné z iných zdrojov.

Sisvel SpA, spoločnosť so sídlom v Luxembursku, spravuje licencie na patenty vzťahujúce sa na MPEG Audio. [103] Spolu so svojou pobočkou v Spojených štátoch Audio MPEG, Inc. predtým žalovali Thomson za porušenie patentu na technológiu MP3, [104] ale tieto spory boli vyriešené v novembri 2005, keď Sisvel udelil Thomsonovi licenciu na ich patenty. Motorola nasledovala čoskoro potom a podpísala so Sisvelom v decembri 2005 licenciu na patenty súvisiace s MP3. [105] Okrem troch patentov vypršala platnosť všetkých amerických patentov spravovaných Sisvelom [106] v roku 2015. Tri výnimky sú: US Patent 5 878 080 , platnosť skončila február 2017; US patent 5,850,456 , platnosť vypršala vo februári 2017; aPatent USA 5 960 037 , ktorého platnosť vypršala 9. apríla 2017.

V septembri 2006 nemeckí úradníci zhabali MP3 prehrávače zo stánku SanDisk na výstave IFA v Berlíne po tom, čo talianska patentová firma vyhrala súdny príkaz v mene Sisvel proti SanDisku v spore o licenčné práva. Súdny príkaz bol neskôr zrušený berlínskym sudcom, [107] ale toto zrušenie bolo v ten istý deň zablokované iným sudcom z toho istého súdu, čím podľa slov jedného komentátora „priniesol patentový divoký západ do Nemecka“. [108] Vo februári 2007 zažalovala spoločnosť Texas MP3 Technologies spoločnosti Apple, Samsung Electronics a Sandisk na federálnom súde vo východnom Texase, tvrdiac porušenie patentu na prenosný MP3 prehrávač, o ktorom spoločnosť Texas MP3 uviedla, že mu bol postúpený. Apple, Samsung a Sandisk urovnali nároky voči nim v januári 2009. [109] [110]

Spoločnosť Alcatel-Lucent uplatnila niekoľko patentov na kódovanie a kompresiu MP3, údajne zdedených od laboratórií AT&T-Bell, v rámci vlastného súdneho sporu. V novembri 2006, pred zlúčením spoločností, Alcatel zažaloval Microsoft za údajné porušenie siedmich patentov. Dňa 23. februára 2007 porota v San Diegu priznala spoločnosti Alcatel-Lucent odškodné vo výške 1,52 miliardy USD za porušenie dvoch z nich. [111] Súd však následne rozhodnutie zrušil, keď zistil, že jeden patent nebol porušený a že druhý nebol vo vlastníctve spoločnosti Alcatel-Lucent ; spoluvlastnili ho AT&T a Fraunhofer, ktorí naň udelili licenciu spoločnosti Microsoft , rozhodol sudca. [112]Tento obranný rozsudok bol potvrdený v odvolacom konaní v roku 2008. [113] Ďalšie informácie pozri Alcatel-Lucent v. Microsoft .

Alternatívne technológie

Existujú aj iné stratové formáty. Spomedzi nich je najpoužívanejšie Advanced Audio Coding (AAC), ktoré bolo navrhnuté ako nástupca MP3. Existujú aj iné stratové formáty ako mp3PRO a MP2 . Sú členmi rovnakej technologickej rodiny ako MP3 a závisia od zhruba podobných psychoakustických modelov a MDCT algoritmov. Zatiaľ čo MP3 používa hybridný prístup kódovania, ktorý je súčasťou MDCT a časťou FFT , AAC je čisto MDCT, čo výrazne zlepšuje účinnosť kompresie. [114] Mnohé zo základných patentov , na ktorých sú založené tieto formáty, vlastní Fraunhofer Society , Alcatel-Lucent,Thomson Consumer Electronics , [114] Bell , Dolby , LG Electronics , NEC , NTT Docomo , Panasonic , Sony Corporation , [115] ETRI , JVC Kenwood , Philips , Microsoft a NTT . [116]

Keď sa trh s digitálnymi audio prehrávačmi rozbiehal, MP3 bol široko prijatý ako štandard, a preto ľudový názov „MP3 prehrávač“. Spoločnosť Sony bola výnimkou a použila svoj vlastný kodek ATRAC prevzatý z formátu MiniDisc , o ktorom spoločnosť Sony tvrdila, že je lepší. [117] Po kritike a nižších ako očakávaných predajoch Walkmanov spoločnosť Sony v roku 2004 po prvýkrát zaviedla natívnu podporu MP3 pre svoje prehrávače Walkman. [118]

Existujú aj otvorené kompresné formáty ako Opus a Vorbis , ktoré sú dostupné bezplatne a bez akýchkoľvek známych patentových obmedzení. Niektoré z novších formátov kompresie zvuku, ako napríklad AAC, WMA Pro a Vorbis, neobsahujú určité obmedzenia spojené s formátom MP3, ktoré nemožno prekonať žiadnym kódovačom MP3. [92]

Okrem stratových metód kompresie sú bezstratové formáty významnou alternatívou k MP3, pretože poskytujú nezmenený zvukový obsah, aj keď so zväčšenou veľkosťou súboru v porovnaní so stratovou kompresiou. Medzi bezstratové formáty patrí FLAC (Free Lossless Audio Codec), Apple Lossless a mnoho ďalších.

Pozri tiež

Referencie

  1. ^ a b "Všetko najlepšie k narodeninám MP3!" . Fraunhofer IIS. 12. júla 2005 . Získané 18. júla 2010 .
  2. ^ Nilsson, M. (november 2000). "Typ média audio/mpeg — RFC 3003" . IETF. doi : 10.17487/RFC3003 . Získané 7. decembra 2009 . {{cite journal}}:Citovať časopis vyžaduje |journal=( pomoc )
  3. ^ Casner, S.; Hoschka, P. (júl 2003). "Registrácia typu MIME formátov užitočného zaťaženia RTP — RFC 3555" . IETF. doi : 10.17487/RFC3555 . Získané 7. decembra 2009 . {{cite journal}}:Citovať časopis vyžaduje |journal=( pomoc )
  4. ^ a b Finlayson, R. (február 2008). "Formát RTP užitočného zaťaženia tolerantnejší voči stratám pre zvuk MP3 — RFC 5219" . IETF. doi : 10.17487/RFC5219 . Získané 4. decembra 2014 . {{cite journal}}:Citovať časopis vyžaduje |journal=( pomoc )
  5. ^ "Tím mp3" . Fraunhofer IIS . Získané 12. júna 2020 .
  6. ^ Patel K, Smith BC, Rowe LA (1. september 1993). "Výkon softvérového dekodéra videa MPEG" . Zborník príspevkov z prvej medzinárodnej konferencie ACM o multimédiách . Multimédiá ACM. New York City: Association for Computing Machinery: 75–82. doi : 10.1145/166266.166274 . ISBN 978-0-89791-596-0. S2CID  3773268 .Odkaz 3 v tomto dokumente je návrh normy ISO/IEC 11172 zo 6. decembra 1991 výboru.
  7. ^ a b c d „ISO/IEC 11172-3:1993 – Informačné technológie – Kódovanie pohyblivých obrázkov a súvisiaceho zvuku pre digitálne pamäťové médiá s rýchlosťou do približne 1,5 Mbit/s – Časť 3: Zvuk“ . ISO. 1993 . Získané 14. júla 2010 .
  8. ^ a b c d „ISO/IEC 13818-3:1995 – Informačné technológie – Všeobecné kódovanie pohyblivých obrázkov a súvisiacich zvukových informácií – Časť 3: Zvuk“ . ISO. 1995 . Získané 14. júla 2010 .
  9. ^ „Technológia MP3 na Fraunhofer IIS“ . Fraunhofer IIS . Archivované z originálu 15. augusta 2021 . Získané 12. júna 2020 .
  10. ^ MP3 (kódovanie zvuku MPEG Layer III) (úplný koncept). Udržateľnosť digitálnych formátov. Washington, DC: Kongresová knižnica. 3. mája 2017 . Získané 1. decembra 2021 .
  11. ^ Jayant, Nikil ; Johnston, James; Šafranek, Robert (október 1993). "Kompresia signálu na základe modelov ľudského vnímania". Zborník IEEE . 81 (10): 1385–1422. doi : 10.1109/5.241504 .
  12. ^ "MP3 (kódovanie zvuku MPEG Layer III)" . Kongresová knižnica. 27. júla 2017 . Získané 9. novembra 2017 .
  13. ^ a b ISO (november 1991). "Tlačová správa MPEG, Kurihama, november 1991" . ISO. Archivované z originálu 3. mája 2011 . Získané 17. júla 2010 .
  14. ^ a b c d e ISO (november 1991). "CD 11172-3 – KÓDOVANIE POHYBLIVÝCH OBRAZOV A SÚVISIACEHO ZVUKU PRE DIGITÁLNE PAMÄŤOVÉ MÉDIÁ AŽ AŽ 1,5 MBIT/s ZVUK 3. časť" (PDF) . Archivované z originálu (PDF) dňa 30. decembra 2013 . Získané 17. júla 2010 .
  15. ^ a b ISO (6. novembra 1992). "Tlačová správa MPEG, Londýn, 6. novembra 1992" . Chiariglione. Archivované z originálu 12. augusta 2010 . Získané 17. júla 2010 .
  16. ^ a b c ISO (október 1998). "MPEG Audio FAQ Verzia 9 – MPEG-1 a MPEG-2 BC" . ISO . Získané 28. októbra 2009 .
  17. ^ Mayer, Alfred Marshall (1894). "Výskumy v akustike" . Londýn, Edinburgh a Dublin Philosophical Magazine . 37 (226): 259-288. doi : 10.1080/14786449408620544 .
  18. ^ Ehmer, Richard H. (1959). "Maskovanie tónmi vs. hlukové pásma". Journal of the Acoutical Society of America . 31 (9): 1253. Bibcode : 1959ASAJ...31.1253E . doi : 10.1121/1.1907853 .
  19. ^ Zwicker, Eberhard (1974). „O psychoakustickom ekvivalente ladiacich kriviek“. Fakty a modely v sluchu . Fakty a modely počutia (Zborník príspevkov zo sympózia o psychofyzikálnych modeloch a fyziologických faktoch počutia; Konané v Tuzingu, Oberbayern, 22. – 26. apríla 1974) . Komunikácia a kybernetika. Vol. 8. s.  132 –141. doi : 10.1007/978-3-642-65902-7_19 . ISBN 978-3-642-65904-1.
  20. ^ Zwicker, Eberhard; Feldtkeller, Richard (1999) [1967]. Das Ohr als Nachrichtenempfänger [ Ucho ako komunikačný prijímač ]. Trans. od Hannesa Müscha, Sørena Buusa a Mary Florentine. Archivované z originálu 14. septembra 2000 . Získané 29. júna 2008 .
  21. ^ Fletcher, Harvey (1995). Reč a sluch v komunikácii . Akustická spoločnosť Ameriky. ISBN 978-1-56396-393-3.
  22. ^ a b c Schroeder, Manfred R. (2014). "Bell Laboratories" . Akustika, informácie a komunikácia: Spomienkový zväzok na počesť Manfreda R. Schroedera . Springer. p. 388. ISBN 9783319056609.
  23. ^ Gray, Robert M. (2010). „História digitálnej reči v reálnom čase v paketových sieťach: Časť II lineárneho prediktívneho kódovania a internetového protokolu“ (PDF) . Nájdené. Trendy Proces signálu . 3 (4): 203-303. doi : 10.1561/2000000036 . ISSN 1932-8346 .  
  24. ^ Atal, B.; Schroeder, M. (1978). "Prediktívne kódovanie rečových signálov a subjektívne chybové kritériá". ICASSP '78. Medzinárodná konferencia IEEE o akustike, reči a spracovaní signálov . 3 : 573-576. doi : 10.1109/ICASSP.1978.1170564 .
  25. ^ Schroeder, MR ; Atal, BS ; Hall, JL (december 1979). „Optimalizácia digitálnych kódovačov reči využívaním maskovacích vlastností ľudského ucha“. Journal of the Acoutical Society of America . 66 (6): 1647. Bibcode : 1979ASAJ...66.1647S . doi : 10.1121/1.383662 .
  26. ^ Krasner, MA (18. júna 1979). Digitálne kódovanie reči a zvukových signálov na základe percepčných požiadaviek sluchového systému (Diplomová práca). Massachusettský Inštitút Technológie. hdl : 1721.1/16011 .
  27. ^ Krasner, MA (18. júna 1979). "Digitálne kódovanie reči na základe percepčnej požiadavky sluchového systému (Technická správa 535)" (PDF) . Archivované (PDF) z originálu 3. septembra 2017.
  28. ^ Ahmed, Nasir (január 1991). „Ako som prišiel k diskrétnej kosínovej transformácii“ . Digitálne spracovanie signálu . 1 (1): 4–5. doi : 10.1016/1051-2004(91)90086-Z .
  29. ^ Ahmed, Násir ; Natarajan, T.; Rao, KR (január 1974), "Discrete Cosine Transform", IEEE Transactions on Computers , C-23 (1): 90–93, doi : 10.1109/TC.1974.223784 , S2CID 149806273 
  30. ^ Rao, KR ; Yip, P. (1990), Discrete Cosine Transform: Algorithms, Advantages, Applications , Boston: Academic Press, ISBN 978-0-12-580203-1
  31. ^ JP Princen, AW Johnson a AB Bradley: Subpásmové/transformačné kódovanie využívajúce návrhy banky filtrov založené na zrušení aliasingu v časovej doméne , IEEE Proc. Intl. Konferencia o akustike, reči a spracovaní signálov (ICASSP), 2161 – 2164, 1987
  32. ^ John P. Princen, Alan B. Bradley: Návrh banky filtrov analýzy/syntézy založený na zrušení aliasingu v časovej doméne , IEEE Trans. Acoust. Spracovanie rečového signálu, ASSP-34 (5), 1153–1161, 1986
  33. ^ a b Guckert, John (jar 2012). „Použitie FFT a MDCT pri kompresii zvuku MP3“ (PDF) . Univerzita v Utahu . Získané 14. júla 2019 .
  34. ^ Terhardt, E.; Stoll, G.; Seewann, M. (marec 1982). "Algoritmus na extrakciu výšky tónu a význačnosti výšky z komplexných tónových signálov". Journal of the Acoutical Society of America . 71 (3): 679. Bibcode : 1982ASAJ...71..679T . doi : 10.1121/1.387544 .
  35. ^ a b "Kódovanie hlasu pre komunikáciu". IEEE Journal on Selected Areas in Communications . 6 (2). februára 1988.
  36. ^ a b c Genesis of the MP3 Audio Coding Standard in IEEE Transactions on Consumer Electronics, IEEE, Vol. 52, č. 3, s. 1043–1049, august 2006
  37. ^ Brandenburg, Karlheinz; Seitzer, Dieter (3. – 6. novembra 1988). OCF: Kódovanie vysokokvalitného zvuku s prenosovou rýchlosťou 64 kbit/s . 85. konvencia spoločnosti audio inžinierstva.
  38. ^ Johnston, James D. (február 1988). "Transformácia kódovania zvukových signálov pomocou kritérií vnímania šumu". IEEE Journal on Selected Areas in Communications . 6 (2): 314-323. doi : 10.1109/49.608 .
  39. ^ YF Dehery a kol. (1991) Zdrojový kodek MUSICAM pre digitálne vysielanie a ukladanie zvuku Proceedings IEEE-ICASSP 91 pages 3605–3608 May 1991
  40. ^ „Komentár k DAB od Alana Boxa, EZ communication a predsedu pracovnej skupiny NAB DAB“ (PDF) .
  41. ^ EBU SQAM CD Hodnotenie kvality zvuku Nahrávky materiálu pre subjektívne testy . 7. októbra 2008.
  42. ^ a b Ewing, Jack (5. marca 2007). „Ako sa zrodilo MP3“ . Bloomberg BusinessWeek . Získané 24. júla 2007 .
  43. ^ Witt, Stephen (2016). Ako sa hudba oslobodila: Koniec priemyslu, prelom storočia a pacient s nulou pirátstva . Spojené štáty americké: Penguin Books. p. 13. ISBN 978-0143109341. K Brandenburgu a Grillovi sa pridali ďalší štyria výskumníci z Fraunhofera. Heinz Gerhauser dohliadal na audio výskumnú skupinu inštitútu; Harald Popp bol hardvérový špecialista; Ernst Eberlein bol odborníkom na spracovanie signálov; Jurgen Herre bol ďalším postgraduálnym študentom, ktorého matematické schopnosti súperili s tými Brandenburskými. V neskorších rokoch sa táto skupina nazývala „pôvodnými šiestimi“.
  44. ^ Jonathan Sterne (17. júla 2012). MP3: Význam formátu . Duke University Press. p. 178. ISBN 978-0-8223-5287-7.
  45. ^ "Suzanne Vega | Životopis" . Oficiálna komunita Suzanne Vega . Získané 17. januára 2022 .
  46. ^ Technológia digitálneho video a audio vysielania: praktická príručka inžinierstva (signály a komunikačné technológie) ISBN 3-540-76357-0 s. 144: "V roku 1988 bola v Institut für Rundfunktechnik (IRT) v Mníchove vyvinutá metóda MASCAM v rámci prípravy na systém digitálneho zvukového vysielania (DAB). Z MASCAM bol MUSICAM (masking pattern universal subband integration and multiplexing) metóda bola vyvinutá v roku 1989 v spolupráci s CCETT, Philips a Matsushita." 
  47. ^ "Správa o stave ISO MPEG" (Tlačová správa). Medzinárodná organizácia pre normalizáciu . septembra 1990. Archivované z originálu 14.2.2010.
  48. ^ "Aspec-Adaptívne spektrálne entropické kódovanie vysoko kvalitných hudobných signálov" . E-knižnica AES . 1991 . Získané 24. augusta 2010 .
  49. ^ a b „Prijaté na 22. zasadnutí WG11“ (Tlačová správa). Medzinárodná organizácia pre normalizáciu . 2. apríla 1993. Archivované z originálu 6. augusta 2010 . Získané 18. júla 2010 .
  50. ^ Brandenburg, Karlheinz; Bosi, Marina (február 1997). "Prehľad zvuku MPEG: Súčasné a budúce štandardy pre kódovanie zvuku s nízkou bitovou rýchlosťou" . Journal of the Audio Engineering Society . 45 (1/2): 4–21 . Získané 30. júna 2008 .
  51. ^ a b c d "Technické podrobnosti MP3 (MPEG-2 a MPEG-2.5)" . Fraunhofer IIS . September 2007. Archivované z originálu 24. januára 2008. "MPEG-2.5" je názov proprietárneho rozšírenia vyvinutého spoločnosťou Fraunhofer IIS. Umožňuje MP3 uspokojivo pracovať pri veľmi nízkych bitových tokoch a zavádza dodatočné vzorkovacie frekvencie 8 kHz, 11,025 kHz a 12 kHz.
  52. ^ a b c d e f g h Supurovič, Predrag (22. december 1999). "Hlavička zvukového rámca MPEG" . Získané 29. mája 2009 .
  53. ^ a b c „ISO/IEC 13818-3:1994(E) – Informačné technológie – Všeobecné kódovanie pohyblivých obrázkov a pridruženého zvuku: Zvuk“ (ZIP) . 11. novembra 1994 . Získané 4. augusta 2010 .
  54. ^ MPEG (25. marec 1994). "Schválené na 26. zasadnutí (Paríž)" . Archivované z originálu 26. júla 2010 . Získané 5. augusta 2010 .
  55. ^ MPEG (11. novembra 1994). "Schválené na 29. zasadnutí" . Archivované z originálu 8. augusta 2010 . Získané 5. augusta 2010 .
  56. ^ ISO. „ISO/IEC TR 11172-5:1998 – Informačné technológie – Kódovanie pohyblivých obrázkov a súvisiaceho zvuku pre digitálne pamäťové médiá rýchlosťou až približne 1,5 Mbit/s – Časť 5: Simulácia softvéru“ . Získané 5. augusta 2010 .
  57. ^ „ISO/IEC TR 11172-5:1998 – Informačné technológie – Kódovanie pohyblivých obrázkov a súvisiaceho zvuku pre digitálne pamäťové médiá rýchlosťou až približne 1,5 Mbit/s – Časť 5: Simulácia softvéru (referenčný softvér)“ (ZIP) . Získané 5. augusta 2010 .
  58. ^ Dehery, Yves-Francois (1994). Vysokokvalitný štandard kódovania zvuku pre vysielacie, telekomunikačné a multimediálne systémy . Holandsko: Elsevier Science BV. s. 53–64. ISBN 978-0-444-81580-4. Tento článok sa týka komprimovanej digitálnej audio pracovnej stanice Musicam (MPEG Audio Layer II) implementovanej na mikropočítači, ktorá sa používa nielen ako profesionálna editačná stanica, ale aj ako server na Ethernete pre komprimovanú digitálnu audio knižnicu, čím sa predvída budúcnosť MP3 na internete.
  59. ^ „Dnešná technológia MP3“ . Veľa informatívnych informácií o hudbe . 2005. Archivované z originálu 4. júla 2008 . Získané 15. septembra 2016 .
  60. ^ Nebeský jukebox na The Atlantic "Aby sme priemyslu ukázali, ako používať kodek, MPEG vytvoril bezplatný vzorový program, ktorý konvertoval hudbu do súborov MP3. Ukážkový softvér vytvoril zvuk nízkej kvality a Fraunhofer nemal v úmysle ho použiť. „Zdrojový kód“ softvéru – jeho základné inštrukcie – bol uložený na ľahko dostupnom počítači na Univerzite v Erlangene, z ktorého ho stiahol jeden SoloH, hacker v Holandsku (a predpokladá sa, že fanúšik Star Wars). SoloH prepracovala zdrojový kód, aby vytvorila softvér, ktorý konvertuje skladby z kompaktných diskov na hudobné súbory prijateľnej kvality." (2000)
  61. ^ Popové idoly a piráti: Mechanizmy spotreby a globálny obeh... od Dr Charles Fairchild
  62. ^ Technológie pirátstva? - Skúmanie súhry medzi komercializmom a idealizmom vo vývoji MP3 a DivX od HENDRIK STORSTEIN SPILKER, SVEIN HÖIER, strana 2072
  63. ^ www.euronet.nl/~soloh/mpegEnc/ ( Archive.org )
  64. ^ „O internetovom archíve podzemnej hudby“ .
  65. ^ ab Schubert , Ruth (10. februára 1999). „Technicky zdatné získavanie hudby pre pieseň; priemysel frustrovaný, že internet robí hudbu zadarmo jednoduchou“ . Seattle Post-Intelligencer . Získané 22. novembra 2008 .
  66. ^ Giesler, Markus (2008). „Konflikt a kompromis: Dráma vo vývoji trhu“. Journal of Consumer Research . 34 (6): 739-753. CiteSeerX 10.1.1.564.7146 . doi : 10.1086/522098 . S2CID 145796529 .  
  67. ^ a b c d Bouvigne, Gabriel (2003). „Technológia MP3 – Obmedzenia“ . Archivované z originálu 7. januára 2011.
  68. ^ "ISO/IEC 11172-3:1993/Cor 1:1996" . Medzinárodná organizácia pre normalizáciu . 2006 . Získané 27. augusta 2009 .
  69. ^ Liberman, Srbsko. DSP – technológia v pozadí multimédií .
  70. ^ Amorim, Roberto (3. august 2003). "Výsledky testu verejného počúvania rozšírenia 128 kbit/s" . Získané 17. marca 2007 .
  71. ^ Mareš, Sebastián (december 2005). "Výsledky verejného multiformátového testu počúvania @ 128 kbps" . Získané 17. marca 2007 .
  72. ^ Dougherty, Dale (1. marec 2009). "Šumivý zvuk hudby" . Radar O'Reilly .
  73. ^ „Zoznámte sa s hudobným jasnovidcom, ktorý nachádza duchov vo vašich MP3“ . HLUČNÝ . 18. marca 2015.
  74. ^ "Duchovia v mp3" . 15. marca 2015.
  75. ^ „Stratené a nájdené: U.Va. Grad Student objavuje duchov v MP3“ . UVA dnes . 23. februára 2015.
  76. ^ Duch v MP3
  77. ^ "Sprievodca možnosťami príkazového riadka (v CVS)" . Získané 4. augusta 2010 .
  78. ^ „Návod na obsluhu JVC RC-EX30“ (PDF) (vo viacerých jazykoch). 2004. s. 14. Archivované z originálu (PDF) 20. augusta 2020. Hľadať – nájdenie požadovanej pozície na disku (iba audio CD) (2004 boombox )
  79. ^ "DV-RW250H Návod na obsluhu SK" (PDF) . 2004. s. 33. • Rýchle prehrávanie dopredu a prezeranie nefunguje pri MP3/WMA/JPEG-CD.
  80. ^ "Porovnanie kvality zvuku Hi-Res Audio vs. CD vs. MP3" . www.sony.com . Sony . Získané 11. augusta 2020 .
  81. ^ Woon-Seng Gan; Sen-Maw Kuo (2007). Vstavané spracovanie signálu s architektúrou Micro Signal Architecture . Wiley-IEEE Press . p. 382. ISBN 978-0-471-73841-1.
  82. ^ Bouvigne, Gabriel (28. novembra 2006). "freeformat pri 640 kbit/s a foobar2000, moznosti?" . Získané 15. septembra 2016 .
  83. ^ "lame(1): vytvorte zvukové súbory mp3 - manuálová stránka Linuxu" . linux.die.net . Získané 22. augusta 2020 .
  84. ^ "Linux Manpages Online - man.cx manuálové stránky" . man.cx . Získané 22. augusta 2020 .
  85. ^ a b "GPSYCHO – Variabilná bitová rýchlosť" . LAME MP3 kodér . Získané 11. júla 2009 .
  86. ^ "TwoLAME: MPEG Audio Layer II VBR" . Získané 11. júla 2009 .
  87. ^ ISO MPEG Audio podskupina. "MPEG Audio FAQ Verzia 9: MPEG-1 a MPEG-2 BC" . Získané 11. júla 2009 .
  88. ^ "LAME Y prepínač" . Hydrogenaudio Knowledgebase . Získané 23. marca 2015 .
  89. ^ Rae, Casey. "Metadáta a vy" . Budúcnosť hudobnej koalície . Získané 12. decembra 2014 .
  90. ^ Patel, Ketan; Smith, Brian C.; Rowe, Lawrence A. Výkon softvérového MPEG video dekodéra (PDF) . Konferencia ACM Multimedia 1993.
  91. ^ "Časté otázky o MPEG, verzia 3.1" . 14. 5. 1994. Archivované z originálu 23. 7. 2009.
  92. ^ a b "Veľký zoznam patentov MP3 (a predpokladané dátumy expirácie)" . melódia . 26. februára 2007.
  93. ^ Cogliati, Josh (20. júla 2008). "Patentový stav MPEG-1, H.261 a MPEG-2" . Kuro5hin .Táto práca nezohľadnila patentové rozdelenia a pokračovania.
  94. ^ Patent USA č. 5812672
  95. ^ "Ukončenie platnosti patentu USA pre MP3, MPEG-2, H.264" . OSNews.com.
  96. ^ „Patent US6009399 – Metóda a prístroj na kódovanie digitálnych signálov... – Patenty Google“ .
  97. ^ "mp3licensing.com – Patenty" . mp3licensing.com .
  98. ^ „Plná podpora MP3 čoskoro vo Fedore“ . 5. mája 2017.
  99. ^ „Kompresia akustických dát – základný patent MP3“ . Základ pre slobodnú informačnú infraštruktúru . 15. januára 2005. Archivované z originálu 15. júla 2007 . Získané 24. júla 2007 .
  100. ^ "Duševné vlastníctvo a licencovanie" . Technicolor . Archivované z originálu 4. mája 2011.
  101. ^ Kistenfeger, Muzinée (júl 2007). "Fraunhoferova spoločnosť (Fraunhofer-Gesellschaft, FhG)" . Britský generálny konzulát v Mníchove. Archivované z originálu 18. augusta 2002 . Získané 24. júla 2007 .
  102. ^ "Skoré vymáhanie patentov MP3" . Chilling Effects Clearinghouse . 1. septembra 1998 . Získané 24. júla 2007 .
  103. ^ "Licenčný program MPEG Audio spoločnosti SISVEL" .
  104. ^ „Audio MPEG a Sisvel: Thomson žaloval za porušenie patentu v Európe a Spojených štátoch – MP3 prehrávače zastavili colnice“ . ZDNet India . 6. októbra 2005. Archivované z originálu 11. októbra 2007 . Získané 24. júla 2007 .
  105. ^ "udeľuje spoločnosti Motorola licenciu na patentovanie zvuku MP3 a MPEG 2" . SISVEL. 21. 12. 2005. Archivované z originálu 21. 1. 2014 . Získané 18. januára 2014 .
  106. ^ "Americké patenty MPEG Audio" (PDF) . Sisvel.
  107. ^ Ogg, Erica (7. september 2006). "Príkaz na zaistenie MP3 od SanDisk bol zrušený" . Správy CNET . Archivované z originálu 4. novembra 2012 . Získané 24. júla 2007 .
  108. ^ „Sisvel prináša patentovaný divoký západ do Nemecka“ . IPEG blog . 7. septembra 2006 . Získané 24. júla 2007 .
  109. ^ "Apple, SanDisk urovnajú patentový spor MP3 v Texase" . IP zákon360 . 26. januára 2009 . Získané 16. augusta 2010 .
  110. ^ "Profesionáli Baker Botts LLP: Lisa Catherine Kelly - Reprezentatívne zásnuby" . Baker Botts LLP . Archivované z originálu 10. decembra 2014 . Získané 15. septembra 2016 .
  111. ^ „Microsoft čelí výplate MP3 vo výške 1,5 miliardy dolárov“ . Správy BBC . 22. februára 2007 . Získané 30. júna 2008 .
  112. ^ „Microsoft vyhráva zrušenie rozhodnutia o patente MP3“ . CNET . 6. augusta 2007 . Získané 17. augusta 2010 .
  113. ^ "Odvolací súd pre rozhodnutie o federálnom obvode" (PDF) . 25. septembra 2008. Archivované z originálu (PDF) dňa 29. októbra 2008.
  114. ^ a b Brandenburg, Karlheinz (1999). "Vysvetlenie MP3 a AAC" . Archivované z originálu (PDF) dňa 19. októbra 2014.
  115. ^ „Via Licensing oznamuje aktualizovanú spoločnú patentovú licenciu AAC“ . Business Wire . 5. januára 2009 . Získané 18. júna 2019 .
  116. ^ "Poskytovatelia licencií AAC" . Via Corp. Získané 6. júla 2019 .
  117. ^ Marriott, Michel (30. september 1999). „SLEDUJTE NOVINKY; Nový prehrávač od Sony prikývne na MP3“ . The New York Times .
  118. ^ "Sony NW-E105 Network Walkman" .

Ďalšie čítanie

Externé odkazy