Chiar în această săptămână, Spotify a început să testeze fișiere audio „fără pierderi”. Dar ce este sunetul „fără pierderi”, exact, și cum funcționează compresia audio digitală?
Cum funcționează compresia audio?
Scopul compresiei audio este de a reduce numărul de biți necesari pentru a reproduce cu precizie un sunet analog. Primul proces pe care îl vom analiza se numește „cu pierderi”. Compresia cu pierderi este o tehnică unidirecțională care aruncă date non-critice pentru a economisi spațiu. Aceste tehnici sunt cele mai frecvente metode utilizate pentru comprimarea fișierelor audio, prezentându-se în fișiere MP3, AAC și WMA. Există două locuri în care codecurile cu pierderi caută să salveze biți: rata de biți și psihoacustica.
Rată de biți
Rata de biți măsoară cantitatea de biți utilizată pentru a codifica o singură secundă de sunet. De exemplu, dacă folosim o codare de 8 kilobiți pe secundă (kbps) de calitate scăzută, algoritmul nostru se limitează la utilizarea a doar 8 kilobiți de date pentru a descrie fiecare secundă de sunet. Este ca și cum ai încerca să descrii o fotografie color cu doar câteva sute de pixeli. S-ar putea să faceți cursele largi corect, dar, în general, veți privi o imagine grav degradată. Dacă folosim o rată de biți de calitate superioară, cum ar fi 192 kbps, avem suficient spațiu pentru a acoperi detalii nuanțate. Pentru a reveni la exemplul nostru fotografic, avem acum suficienți pixeli pentru a descrie diferitele lumini, întunecuri și culori dintr-o imagine. O rată de biți ridicată nu determină singură calitatea unei înregistrări, dar o rată de biți scăzută poate limita sever calitatea ieșirii.
Psihoacustica
Psihoacustica este știința modului în care creierul înțelege sunetele. Manipulând ciudățenii cunoscute în modul în care oamenii percep sunetul, algoritmii de compresie pot elimina inteligent detalii pe care majoritatea urechilor umane nu le vor rata. Scopul este de a „rotunji” informațiile care nu vor schimba calitatea audio percepută a unei piese, eliminând judicios doar informațiile neimportante.
De exemplu, s-ar putea să știți gama tipică a auzului uman este între 20Hz și 20kHz. Evident, sunetele din afara acestui interval pot fi eliminate. În plus, cea mai detaliată gamă a auzului uman este între 100Hz și 4kHzși eliminarea sunetelor silențioase în afara acelor intervale de frecvență afectează minim calitatea unei înregistrări. Putem face un truc similar cu sunete foarte contrastante. Dacă un sunet foarte puternic și un sunet foarte silențios se joacă în același timp, sunetul liniștit este mult mai greu de perceput decât ar fi singur. Codificatorii profită de această „mascare a sunetului” pentru a elimina sunetul liniștit, economisind biți în proces.
Frecvența poate influența, de asemenea, cât de bine percepem sunetele. De exemplu, un ritm de tambur persistent, cu frecvență joasă, tinde să înăbușe armonicele mai delicate și cu frecvență mai mare ale instrumentelor melodice. Și mascarea sunetului este deosebit de eficientă la peste 15 kHz, unde auzul uman este de obicei mai puțin sensibil pentru început.
Schemele comune de compresie audio, cum ar fi MP3, profită de întreaga gamă de posibilități de compresie, încercând în același timp să rămână cât mai fidel înregistrării originale. Desigur, unii oameni simt că eliminarea acestor frecvențe dăunează grav înregistrării. De aceea există standarde de compresie fără pierderi.
Ce este sunetul „fără pierderi”?
Scopul compresiei audio fără pierderi este de a reduce dimensiunea fișierului, lăsând neatins sunetul original. Aceste codecuri nu folosesc niciuna dintre tehnicile de compresie permanentă de mai sus, concentrându-se în schimb pe metodele de compresie a datelor complet reversibile. Folosesc tehnici de compresie fără pierderi împrumutate din algoritmi de compresie a fișierelor, cum ar fi ZIP, pentru a elimina datele redundante, păstrând în același timp integritatea informațiilor de bază. Două codecuri audio fără pierderi populare – FLAC și Apple Lossless (ALAC) – ambele utilizează scheme bazate pe compresie ZIP.
Concentrarea pe compresia de date înseamnă doar păstrarea multor detalii pe care MP3 și alte standarde cu pierderi le-ar șterge. Dacă aveți urechi ascuțite și o configurație de ascultare de înaltă calitate, diferența poate fi palpabilă.
Cu toate acestea, compresia fără pierderi nu este bună doar pentru ascultare: este și un instrument excelent de stocare. La fel cum nu ați dori ca un JPG de 72 dpi să fie singura copie digitală a fotografiilor lui Ansel Adam, nu dorim doar MP3-uri de 128 kbps de tipul „Kind of Blue”. Standardele fără pierderi, cum ar fi FLAC, ne permit să stocăm audio eficient, fără a arunca date potențial valoroase. De asemenea, fac remasterizarea și redistribuirea acelui sunet mai ușoară, deoarece începând cu masterele fără compromisuri înseamnă un produs finit de calitate superioară.
Concluzie: Poți spune diferența?
Formatele audio fără pierderi permit înregistrări mai bune. Dar, uneori, diferențele dintre un fișier MP3 de înaltă calitate și un fișier fără pierderi sunt aproape imperceptibile, în special pentru urechea neinstruită. Dacă doriți să vedeți dacă căștile (și urechile) dvs. sunt suficient de dornice să facă diferența, NPR are un test distractiv; Rețineți că căștile și difuzoarele ieftine pentru laptop nu vor putea reproduce diferențele subtile dintre sunetul fără pierderi și MP3-urile. Pentru o analiză mai serioasă a codecurilor, verificați Evaluările codificatorului SoundExpert.