Librosa

Open-Source-Python-Bibliothek für die Audioverarbeitung

Python-API, die es Entwicklern ermöglicht, Audio von der Festplatte zu laden und abzuspielen, verschiedene Spektrogrammdarstellungen zu berechnen und vieles mehr.

Librosa ist eine sehr nützliche Python-Musik- und Audioanalysebibliothek, die Softwareentwicklern hilft, Anwendungen für die Arbeit mit Audio- und Musikdateiformaten mit Python zu erstellen. Die Bibliothek ist sehr einfach zu bedienen und kann sowohl grundlegende als auch fortgeschrittene Aufgaben im Zusammenhang mit der Audio- und Musikverarbeitung erledigen. Die Bibliothek ist Open Source und steht unter der ISC-Lizenz frei zur Verfügung.

Die Bibliothek bietet erfahrenen Benutzern ein hohes Maß an Flexibilität und ist gleichzeitig auch großartig für Anfänger, die sich mehr für die Verarbeitung von Audiodateien interessieren. Die Bibliothek hat Unterstützung für mehrere wichtige Funktionen im Zusammenhang mit der Verarbeitung und Extraktion von Audiodateien enthalten, wie z. sequentielle Modellierung, Integration von harmonisch-perkussiver Trennung, taktsynchron und vieles mehr.

Auf einen Blick

Eine Übersicht über die Funktionen von Librosa.

Funktionsübersicht

Audio abspielen
Audio visualisieren
Audiofunktionen extrahieren
Audiodateien verwalten
MP3-Unterstützung
Audio-Sprites
Automatisches Caching
Griffrand
Kodiert Audios
Dekodiert Audios
Sequenzielle Modellierung
Beat-synchron

Librosa

Librosa unterstützt die unten aufgeführten Audiodateiformate.

Leser

MP3, WAV, WMA, WEBM

Schriftsteller

MP3, WAV, WMA, WEBM

Librosa

Plattformunabhängigkeit

Librosa erfordert nur die Python-Laufzeit.

Python

Librosa

Erste Schritte mit Librosa

Der einfachste Weg, Librosa zu installieren, ist die Verwendung des Python Package Index (PyPI). Bitte verwenden Sie den folgenden Befehl für die vollständige Installation.

Installieren Sie Librosa mit PyPI

 python -m pip install librosa

Laden und Visualisieren von Audiodateien über Python

Die Python-Bibliothek Librosa ermöglicht es Softwareprogrammierern, Audiodateien in ihre eigene Python-Anwendung zu laden und zu visualisieren. Zunächst müssen Sie die Audiodatei laden und mit einem Python-Befehl in Jupyter Notebook abspielen. Als Nächstes können Sie das abgetastete Signal einfach visualisieren und grafisch darstellen. Sie können die Wellenform-Visualisierung der Amplitude im Vergleich zur Zeitdarstellung des Signals oder auch die Spektrogramm-Visualisierung oder die Log-Frequenz-Achse verwenden.

Audiosignal über Python erstellen und speichern

Analoge und digitale Signale sind beides verschiedene Arten von Signalen, die Informationen übertragen können. Ein digitales Audiosignal ist ein NumPy-Array mit einer bestimmten Frequenz und Abtastrate. Andererseits stellt das analoge Wellenformat des Audiosignals eine Funktion dar. Die Open-Source-Python-Bibliothek Librosa gibt Softwareentwicklern die Möglichkeit, ein Audiosignal zu erstellen und es mit Python-Code an einem Ort ihrer Wahl zu speichern.

Audio-Feature mit Python extrahieren

Die Open-Source-Python-Bibliothek Librosa gibt Softwareentwicklern die Möglichkeit, Audiofunktionen mithilfe von Python-Befehlen in ihre eigenen Apps zu laden und zu extrahieren. Es gibt verschiedene Möglichkeiten, Merkmale aus Audiodaten zu extrahieren, wie z. B. Nulldurchgangsrate, spektrale Rolloff-Frequenz, Mel-Frequenz-Cepstral-Koeffizienten (MFCC), Chroma-Frequenzen und viele mehr.