Cum funcționează compresia audio și ce este audio „fără pierderi”?

Come funziona la compressione audio e cos’è l’audio “senza perdita di dati”?

Proprio questa settimana, Spotify ha iniziato a testare file audio “senza perdita di dati”. Ma cos’è esattamente l’audio “senza perdita di dati” e come funziona la compressione audio digitale?

Come funziona la compressione audio?

L’obiettivo nella compressione audio è ridurre il numero di bit necessari per riprodurre accuratamente un suono analogico. Il primo processo che esamineremo è chiamato “lossy”. La compressione lossy è una tecnica unidirezionale che elimina i dati non critici per risparmiare spazio. Queste tecniche sono i metodi più comuni utilizzati per comprimere i file audio, visualizzati in file MP3, AAC e WMA allo stesso modo. Ci sono due posizioni in cui i codec con perdita di dati cercano di risparmiare bit: bit rate e psicoacustica.

Velocità in bit

segnale di compressione audio quantizzato

La velocità in bit misura la quantità di bit utilizzati per codificare un singolo secondo di audio. Ad esempio, se utilizziamo una codifica di bassa qualità, 8 kilobit al secondo (kbps), il nostro algoritmo si limita a utilizzare solo 8 kilobit di dati per descrivere ogni secondo di audio. È come cercare di descrivere una fotografia a colori con solo poche centinaia di pixel. Potresti ottenere i tratti ampi, ma nel complesso guarderai un’immagine gravemente degradata. Se utilizziamo un bit rate di qualità superiore come 192 kbps, abbiamo molto spazio per coprire dettagli sfumati. Per tornare al nostro esempio fotografico, ora abbiamo abbastanza pixel per descrivere le varie luci, ombre e colori in un’immagine. Un bit rate elevato non determina da solo la qualità di una registrazione, ma un bit rate basso può limitare notevolmente la qualità dell’output.

Psicoacustica

512px-psm_v14_d076_auditory_canal_bones

La psicoacustica è la scienza di come il cervello comprende i suoni. Manipolando stranezze note nel modo in cui gli esseri umani percepiscono il suono, gli algoritmi di compressione possono rimuovere abilmente dettagli che la maggior parte delle orecchie umane non mancheranno. L’obiettivo è quello di “arrotondare” le informazioni che non cambieranno la qualità audio percepita di una traccia, rimuovendo giudiziosamente solo le informazioni non importanti.

Ad esempio, potresti sapere la gamma tipica dell’udito umano è compreso tra 20 Hz e 20 kHz. Ovviamente, i suoni al di fuori di tale intervallo possono essere rimossi. Inoltre, la gamma più dettagliata dell’udito umano è compresa tra 100Hz e 4kHze la rimozione di suoni deboli al di fuori di tali gamme di frequenza danneggia minimamente la qualità di una registrazione. Possiamo fare un trucco simile con suoni altamente contrastanti. Se un suono molto forte e un suono molto basso vengono riprodotti allo stesso tempo, il suono basso è molto più difficile da percepire di quanto lo sarebbe da solo. Gli encoder sfruttano questo “mascheramento del suono” per rimuovere il suono silenzioso, risparmiando bit nel processo.

La frequenza può anche influire sulla percezione dei suoni. Ad esempio, un battito di batteria persistente a bassa frequenza tende a soffocare le armoniche più delicate e ad alta frequenza degli strumenti melodici. E il mascheramento del suono è particolarmente efficace sopra i 15 kHz, dove l’udito umano è in genere meno sensibile all’inizio.

I comuni schemi di compressione audio come MP3 sfruttano l’intera gamma di possibilità di compressione cercando di rimanere il più fedele possibile alla registrazione originale. Naturalmente, alcune persone pensano che la rimozione di queste frequenze danneggi seriamente la registrazione. Ecco perché esistono standard di compressione senza perdita di dati.

Che cos’è l’audio “senza perdita di dati”?

cuffie-compressione-audio

L’obiettivo della compressione audio senza perdita è ridurre le dimensioni del file lasciando intatto l’audio originale. Questi codec non utilizzano nessuna delle tecniche di compressione permanente sopra, concentrandosi invece su metodi di compressione dei dati completamente reversibili. Utilizzano tecniche di compressione senza perdita di dati prese in prestito da algoritmi di compressione di file come ZIP per rimuovere i dati ridondanti preservando l’integrità delle informazioni sottostanti. Due popolari codec audio lossless, FLAC e Apple Lossless (ALAC), utilizzano entrambi schemi basati sulla compressione ZIP.

Concentrarsi sulla compressione dei dati significa solo preservare molti dei dettagli che MP3 e altri standard con perdita di dati cancellerebbero. Se hai orecchie acute e una configurazione di ascolto di alta qualità, la differenza può essere palpabile.

La compressione senza perdita non è utile solo per l’ascolto: è anche un ottimo strumento di archiviazione. Proprio come non vorresti che un JPG a 72 dpi fosse l’unica copia digitale delle fotografie di Ansel Adam, non vogliamo solo MP3 a 128 kbps di “Kind of Blue”. Gli standard senza perdita di dati come FLAC ci consentono di archiviare l’audio in modo efficiente senza gettare dati potenzialmente preziosi. Rendono anche più facile la rimasterizzazione e la ridistribuzione di quell’audio, poiché iniziare con master senza compromessi significa un prodotto finito di qualità superiore.

Conclusione: puoi dire la differenza?

I formati audio senza perdita consentono registrazioni dal suono migliore. Ma a volte le differenze tra un MP3 di alta qualità e un file senza perdita di dati sono quasi impercettibili, soprattutto per l’orecchio inesperto. Se vuoi vedere se le tue cuffie (e le tue orecchie) sono abbastanza interessate da capire la differenza, NPR ha un test divertente; tieni presente che cuffie economiche e altoparlanti per laptop non saranno in grado di riprodurre le sottili differenze tra audio lossless e MP3. Per un’analisi più seria dei codec, controlla Valutazioni dell’encoder di SoundExpert.