Librosa
Python-bibliotek med öppen källkod för ljudbehandling
Python API som låter utvecklare ladda och spela upp ljud från disk, beräkna olika spektrogramrepresentationer och mycket mer.
Librosa är ett mycket användbart Python-musik- och ljudanalysbibliotek som hjälper mjukvaruutvecklare att bygga applikationer för att arbeta med ljud- och musikfilformat med Python. Biblioteket är mycket lätt att använda och kan hantera grundläggande såväl som avancerade uppgifter relaterade till ljud- och musikbehandling. Biblioteket är öppen källkod och är fritt tillgängligt under ISC-licensen.
Biblioteket ger en stor flexibilitet för expertanvändare och samtidigt fantastiskt för nybörjare som är mer intresserade av att bearbeta ljudfiler. Biblioteket har inkluderat stöd för flera viktiga funktioner relaterade till bearbetning och extrahering av ljudfiler, såsom att ladda ljud från disk, beräkning av olika spektrogramrepresentationer, harmonisk-perkussiv källseparation, generisk spektrogramsönderdelning, laddar och avkodar ljudet, tidsdomänljudbehandling, sekventiell modellering, integrera harmonisk-perkussiv separation, beat-synkron och många fler.
Komma igång med Librosa
Det enklaste sättet att installera Librosa är att använda Python Package Index (PyPI). Använd följande kommando för fullständig installation.
Installera Librosa med PyPI
python -m pip install librosa
Ladda och visualisera ljudfiler via Python
Python-biblioteket Librosa tillåter programvaruprogrammerare att ladda och visualisera ljudfiler i sin egen Python-applikation. Först och främst måste du ladda ljudfilen och spela upp den genom att använda ett Python-kommando i Jupyter Notebook. Därefter kan du enkelt visualisera den samplade signalen och plotta den. Du kan använda vågformsvisualisering av amplituden kontra tidsrepresentationen av signalen eller kan också använda Spectrogramvisualisering eller Log-frekvensaxel.
Skapa och spara ljudsignal via Python
Analoga och digitala signaler är båda olika typer av signaler som kan bära information. En digital ljudsignal är en NumPy-array med en specificerad frekvens och samplingshastighet. Å andra sidan representerar ljudsignalens analoga vågformat en funktion. Python-biblioteket Librosa med öppen källkod ger mjukvaruutvecklare kraften att skapa en ljudsignal och spara den på den plats de väljer med hjälp av Python-kod.
Extrahera ljudfunktionen med Python
Python-biblioteket Librosa med öppen källkod ger mjukvaruutvecklare möjligheten att ladda och extrahera ljudfunktioner i sina egna appar med Python-kommandon. Det finns olika sätt att extrahera funktioner från ljuddata, såsom nollgenomgångshastighet, spektral avrullningsfrekvens, Mel-frekvens cepstralkoefficienter (MFCC), Chroma Frequency och många fler.