Funktionsweise von Musikidentifikations-Apps

Cum funcționează aplicațiile de identificare a muzicii
⏱️ 5 min read

Seit seiner Gründung im Jahr 1999 wurde Shazam verwendet, um Songs mehr als fünfzig Milliarden Mal zu identifizieren, und dabei werden nicht einmal die IDs von Soundhound, MusicID und anderen Sounderkennungs-Apps berücksichtigt.

Aus Anwendersicht ist es ganz einfach: Starten Sie die App, drücken Sie eine Taste und lassen Sie Ihr Telefon den Titel anhören. Nach einigen Sekunden zeigt Ihnen die App trotz Hintergrundgeräuschen und Verzerrungen, was der Song ist. Es funktioniert so schnell und so gut, dass es fast wie Magie wirkt – aber wie bei den meisten magischen Dingen heutzutage wird es hauptsächlich von Algorithmen ausgeführt.

[FIX] "Kein Internet, Gesichert...
[FIX] "Kein Internet, Gesichert" Windows 10/11| Routech

Welche Idee steckt hinter diesen Apps?

Shazam, Soundhound und andere Musikidentifizierungsdienste funktionieren im Wesentlichen auf die gleiche Weise: Sie verfügen über eine große Datenbank mit Songinformationen, einen Algorithmus, mit dem Informationen schnell aus Ihrem Songbeispiel extrahiert werden können, und eine App, mit der Sie mit diesen Dingen kommunizieren können. Technisch gesehen brauchen Sie nicht einmal ein Smartphone.

Shazam war ursprünglich auf altmodischen Flip-Phones verwendbar, indem nur ein Song aufgenommen und an den Dienst gesendet wurde. Soundhound ist tatsächlich ein paar Schritte weiter gegangen, indem Sie auch in ihre App singen oder summen können, die mit einer vom Benutzer eingereichten Datenbank anderer Gesangs- / Brummaufnahmen übereinstimmt.

Wie arbeiten Sie?

Musik-Fingerabdruck

In einfachen Worten sieht der Prozess folgendermaßen aus:

  1. Die Datenbank der App enthält eine umfangreiche Sammlung von Song-Fingerabdrücken oder kleinen Daten zu den einzigartigen Klangmustern des Songs.
  2. Wenn ein Benutzer auf die Schaltfläche „Aufnehmen“ klickt, hört die App die Musik und erstellt einen Fingerabdruck basierend auf den wenigen Sekunden Audio, die er hört.
  3. Dieser Fingerabdruck wird mit der Datenbank vorhandener Fingerabdrücke verglichen. Wenn Ihr 10-Sekunden-Fingerabdruck mit einem Teil eines Songs übereinstimmt, erhalten Sie Ihr (hoffentlich korrektes) Song-Ergebnis. Wenn dies nicht der Fall ist, wird ein Fehler zurückgegeben.

Wenn Sie nur nach einer Erklärung auf Oberflächenebene suchen, ist das alles, was Sie wissen müssen. Der wirklich interessante Teil ist, wie Sie diesen Fingerabdruck tatsächlich erhalten.

Song Fingerabdrücke

Musik-Erkennungs-Hashing

Alles beginnt mit einem Spektrogramm, wie es in der obigen Grafik dargestellt ist ein Papier, das von einem von Shazams Gründern, Avery Wang, geschrieben wurde. Dies ist im Wesentlichen ein Diagramm mit der Zeit auf der x-Achse (horizontal), der Frequenz auf der y-Achse (vertikal) und der Amplitude, die durch unterschiedliche Farbintensitätsniveaus dargestellt wird. Jede Folge von Tönen kann somit in ein Spektrogramm umgewandelt werden, und jedem Punkt auf dem Spektrogramm kann ein Satz von Koordinaten zugewiesen werden. Notizen können einfach so Zahlen sein.

Wenn Sie nur ein paar Geräusche aufeinander abstimmen müssten, könnten Sie hier aufhören. Wenn Sie jedoch eine Datenbank mit Millionen von Songs durchsuchen möchten, enthält ein detailliertes Spektrogramm viel zu viele Datenpunkte, um mit jeder Geschwindigkeit durchsucht zu werden.

Der große Durchbruch bei der Musikerkennung war die Erkenntnis, dass Sie Sounds mit nur wenigen Daten identifizieren können: den Peaks oder den intensivsten Teilen. Das Entfernen der meisten energiearmen Teile eines Songs verringert nicht nur die Größe des Spektrogramms, sondern macht die Apps auch weniger anfällig dafür, stumpfe, konsistente Hintergrundgeräusche als Teil der Zielgeräusche zu identifizieren. Stellen Sie sich eine Skyline der Stadt vor – die erkennbarsten Teile sind die Gebäudespitzen, nicht die mittleren Stockwerke, und das können Sie von weitem sehen.

So wird jede Sekunde eines jeden Songs auf einige der intensivsten Datenpunkte reduziert. Alles auf der Skyline der Stadt wird entfernt, außer ganz oben. Aber das ist immer noch nicht effizient genug, um sofort durchsuchbar zu sein. Der nächste Schritt ist also “Hash” diese Folge von Peaks. Hashing nimmt einfach eine Reihe von Eingaben, führt sie durch einen Algorithmus und weist ihnen eine ganzzahlige Ausgabe zu. In diesem Fall wird der Hash erzeugt, indem zwei der hochintensiven Peaks genommen, die Zeit zwischen ihnen gemessen und ihre beiden Frequenzen addiert werden.

Das Ergebnis ist eine Reihe von Zahlen, die leicht zu speichern und zu durchsuchen sind. Wenn ein Computer diesen Hash liest, erkennt er, dass er Frequenz und Zeitdistanz darstellt. Sobald alle Peaks im Song identifiziert und gehasht wurden, ist die Transformation abgeschlossen: Der Song hat jetzt eine eindeutige 32-Bit-Nummer, die als ID in der Datenbank dient. Noch wichtiger ist, dass jede Sekunde des Songs durch die Zahlen dargestellt wird.

Wenn Ihr Telefon Musik hört, durchläuft es genau diesen Vorgang: Es filtert alles außer den höchsten Punkten heraus, hasht sie und erstellt für die wenigen Sekunden, die es aufgezeichnet hat, einen Fingerabdruck. Sobald dies abgeschlossen ist, muss Ihr Telefon nur noch sehen, wo die entsprechenden Zahlenfolgen in der Datenbank angezeigt werden, damit es die erkannten Frequenzen und das Timing mit dem richtigen Titel abgleichen und in Sekunden an Sie zurücksenden kann.

Musik und mehr

Diese Technologie wurde am häufigsten für die Musikerkennung verwendet, aber Tonerkennungs-Apps können auch mit Filmen, Werbespots, TV-Shows, Vogelliedern und vielem mehr verwendet werden. Shazam und Soundhound sind die bekanntesten, aber Sie können jetzt auch Google fragen Welches Lied wird abgespielt und Sie erhalten eine genaue Antwort.

Und wenn Sie sich fragen: “Verfolgen diese Unternehmen, nach welchen Songs gefragt wird?” Die Antwort ist ja.” Musikidentifikationsstatistiken haben tatsächlich war in der Lage, den Erfolg von Liedern und Künstlern mit einer ziemlich hohen Genauigkeit vorherzusagenund große Plattenlabels wie Warner haben Verträge mit Apps wie Shazam abgeschlossen, um aufstrebende Künstler zu finden. Wenn Sie also einen Künstler unterstützen möchten, können Sie auch Ihren Teil dazu beitragen und dessen Lied nachschlagen! Sie können ihnen nur beim Abheben helfen.

Join our Newsletter and receive offers and updates! ✅

0 0 votes
Article Rating
Avatar of Routech

Routech

Routech is a website that provides technology news, reviews and tips. It covers a wide range of topics including smartphones, laptops, tablets, gaming, gadgets, software, internet and more. The website is updated daily with new articles and videos, and also has a forum where users can discuss technology-related topics.

Das könnte dich auch interessieren …

Abonnieren
Benachrichtige mich bei
guest
0 Comments
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x