Cum funcționează aplicațiile de identificare a muzicii

Cum funcționează aplicațiile de identificare a muzicii
⏱️ 6 min read

De când a început în 1999, Shazam a fost folosit pentru a identifica melodiile de peste cincizeci de miliarde de ori și asta nu contează nici măcar ID-urile de la Soundhound, MusicID și alte aplicații de recunoaștere a sunetului.

Din perspectiva utilizatorului, este simplu: porniți aplicația, apăsați un buton și lăsați telefonul să asculte melodia. După câteva secunde, chiar și cu zgomot de fond și distorsiuni, aplicația vă va spune care este melodia. Funcționează atât de repede și atât de bine încât pare aproape ca magie – dar, la fel ca în majoritatea lucrurilor magice din zilele noastre, este administrat în principal de algoritmi.

Cum Se Remediază Datele Mobile Car...
Cum Se Remediază Datele Mobile Care Nu Funcționează Pe Android

Care este ideea din spatele acestor aplicații?

Shazam, Soundhound și alte servicii de identificare a muzicii funcționează practic în același mod: au o bază de date mare de informații despre melodie, un algoritm care poate extrage rapid informații din eșantionul de melodie și o aplicație care vă permite să vă interfațați cu aceste lucruri. Din punct de vedere tehnic, nici măcar nu aveți nevoie de un smartphone.

Shazam era inițial utilizabil pe telefoanele flip de modă veche, doar înregistrând o melodie și trimitându-i mesaje text la serviciu. Soundhound a parcurs câțiva pași mai departe, permițându-vă, de asemenea, să cântați sau să fredonați în aplicația lor pe care o potrivesc cu o bază de date trimisă de utilizator cu alte înregistrări de cântat / fredonat.

Cum funcționează?

muzică-amprentă

În termeni simpli, procesul arată astfel:

  1. Baza de date a aplicației are o colecție masivă de „amprente digitale” ale pieselor sau mici bucăți de date despre tiparele sonore unice ale melodiei.
  2. Când un utilizator apasă butonul „Înregistrați”, aplicația ascultă muzica și creează o amprentă pe baza celor câteva secunde de sunet pe care le aude.
  3. Această amprentă este comparată cu baza de date a amprentelor existente. Dacă amprenta dvs. de zece secunde se potrivește cu o parte a unei melodii, veți obține rezultatul melodiei (sperăm că este corect). În caz contrar, veți primi înapoi o eroare.

Dacă sunteți doar în căutarea unei explicații la nivel de suprafață, asta este tot ce trebuie să știți. Partea cu adevărat interesantă este modul în care obțineți de fapt acea amprentă digitală.

Amprentele cântecului

muzică-recunoaștere-hashing

Totul începe cu o spectrogramă, ca cea din graficul de mai sus, preluată din o lucrare scrisă de unul dintre fondatorii lui Shazam, Avery Wang. Acesta este în esență un grafic cu timpul pe axa x (orizontală), frecvența pe axa y (verticală) și amplitudinea reprezentată de diferite niveluri de intensitate a culorii. Orice secvență de sunete poate fi astfel convertită într-o spectrogramă și oricărui punct de pe spectrogramă i se poate atribui un set de coordonate. La fel, notele pot fi numere.

Dacă tot ce trebuia să faci era să asortezi câteva sunete unele cu altele, te-ai putea opri aici. Dacă doriți să căutați într-o bază de date plină de milioane de melodii, totuși, o spectrogramă cu detalii complete are prea multe puncte de date pentru a privi cu orice fel de viteză.

Marea descoperire în recunoașterea muzicii a fost realizarea că puteți identifica sunetele doar cu câteva bucăți de date: vârfurile sau părțile cele mai intense. Nu numai că scăpați de majoritatea părților cu energie redusă ale unei melodii scade dimensiunea spectrogramei, dar face ca aplicațiile să fie mai puțin susceptibile la identificarea zgomotului de fundal plictisitor și consecvent ca parte a sunetelor țintă. Imaginați-vă un orizont al orașului – cele mai identificabile părți sunt vârfurile clădirilor, nu etajele din mijloc, și asta puteți vedea de departe.

Deci, fiecare secundă a fiecărei melodii este eliminată la doar câteva dintre cele mai intense date; totul de pe orizontul orașului este eliminat, cu excepția vârfului. Dar acest lucru nu este încă suficient de eficient pentru a putea fi căutat imediat, așa că următorul pas este să îl faceți „Hash” această secvență de vârfuri. Hashing pur și simplu ia un set de intrări, le rulează printr-un algoritm și le atribuie o ieșire întreagă. În acest caz, hash-ul este generat prin luarea a două dintre vârfurile de intensitate mare, măsurarea timpului dintre ele și adăugarea celor două frecvențe împreună.

Rezultatul este un șir de numere, ușor de stocat și de căutat. Când un computer citește acest hash, îl va recunoaște ca reprezentând frecvență și distanță de timp. Odată ce toate vârfurile din melodie au fost identificate și marcate, transformarea este completă: melodia are acum un număr unic de 32 de biți care servește drept ID-ul său în baza de date. Mai important, fiecare secundă a cântecului este reprezentată de cifre.

Când telefonul dvs. aude muzică, trece prin acest proces exact: filtrează orice, în afară de cele mai înalte puncte, le hashează și creează o amprentă digitală pentru câteva secunde pe care le-a înregistrat. Odată ce acest lucru este finalizat, telefonul dvs. trebuie doar să vadă unde apar șirurile de numere corespunzătoare în baza de date, permițându-i să potrivească frecvențele și sincronizarea detectate cu melodia corectă și să vi le returneze în câteva secunde.

Muzică și multe altele

Această tehnologie a fost utilizată cel mai mult pentru recunoașterea muzicii, dar aplicațiile de recunoaștere a sunetului pot funcționa și cu filme, reclame, emisiuni TV, cântece de păsări și multe altele. Shazam și Soundhound sunt cele mai cunoscute, dar acum puteți întreba și Google ce melodie se joacă și obțineți un răspuns precis.

Și dacă vă întrebați: „Aceste companii țin evidența despre ce melodii sunt întrebat?” raspunsul este da.” Statisticile de identificare a muzicii au de fapt a fost capabil să prezică succesul melodiilor și al artiștilor cu un nivel destul de ridicat de acuratețe, și mari case de discuri precum Warner s-au contractat cu aplicații precum Shazam pentru a ajuta la găsirea artiștilor viitori. Deci, dacă doriți să sprijiniți un artist, puteți face la fel de bine partea dvs. și să căutați melodia lor! S-ar putea să îi ajuți doar să decoleze.

Join our Newsletter and receive offers and updates! ✅

0 0 votes
Article Rating
Avatar of Routech

Routech

Routech is a website that provides technology news, reviews and tips. It covers a wide range of topics including smartphones, laptops, tablets, gaming, gadgets, software, internet and more. The website is updated daily with new articles and videos, and also has a forum where users can discuss technology-related topics.

You may also like...

Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
()
x