Librosa
Open source Python-bibliotheek voor audioverwerking
Python API waarmee ontwikkelaars audio van schijf kunnen laden en afspelen, verschillende spectrogramrepresentaties kunnen berekenen en nog veel meer.
Librosa is een zeer nuttige Python-muziek- en audio-analysebibliotheek die softwareontwikkelaars helpt bij het bouwen van applicaties voor het werken met audio- en muziekbestandsformaten met behulp van Python. De bibliotheek is zeer gebruiksvriendelijk en kan zowel basis- als geavanceerde taken met betrekking tot audio- en muziekverwerking aan. De bibliotheek is open source en is vrij beschikbaar onder de ISC-licentie.
De bibliotheek biedt veel flexibiliteit voor ervaren gebruikers en tegelijkertijd ook geweldig voor beginnende gebruikers die meer geïnteresseerd zijn in het verwerken van audiobestanden. De bibliotheek heeft ondersteuning geboden voor verschillende belangrijke functies met betrekking tot de verwerking en extractie van audiobestanden, zoals het laden van audio van schijf, het berekenen van verschillende spectrogramrepresentaties, harmonisch-percussieve bronscheiding, generieke spectrogramdecompositie, het laden en decoderen van de audio, tijdsdomein audioverwerking, sequentiële modellering, integratie van harmonisch-percussieve scheiding, beat-synchroon en nog veel meer.
Aan de slag met Librosa
De eenvoudigste manier om Librosa te installeren, is door de Python Package Index (PyPI) te gebruiken. Gebruik de volgende opdracht voor een volledige installatie.
Installeer Librosa met PyPI
python -m pip install librosa
Audiobestanden laden en visualiseren via Python
Met de Python-bibliotheek Librosa kunnen softwareprogrammeurs audiobestanden laden en visualiseren in hun eigen Python-toepassing. Allereerst moet u het audiobestand laden en afspelen met een Python-opdracht in Jupyter Notebook. Vervolgens kunt u het gesamplede signaal eenvoudig visualiseren en plotten. U kunt golfvormvisualisatie van de amplitude versus de tijdweergave van het signaal gebruiken of u kunt ook Spectrogramvisualisatie of log-frequentie-as gebruiken.
Audiosignaal maken en opslaan via Python
Analoge en digitale signalen zijn beide verschillende soorten signalen die informatie kunnen bevatten. Een digitaal audiosignaal is een NumPy-array met een gespecificeerde frequentie en samplefrequentie. Aan de andere kant vertegenwoordigt het analoge golfformaat van het audiosignaal een functie. De open source Python-bibliotheek Librosa geeft softwareontwikkelaars de mogelijkheid om een audiosignaal te creëren en op te slaan op de plaats van hun keuze met behulp van Python-code.
Audiofunctie extraheren met Python
De open source Python-bibliotheek Librosa geeft softwareontwikkelaars de mogelijkheid om audiofuncties in hun eigen apps te laden en te extraheren met behulp van Python-opdrachten. Er zijn verschillende manieren om kenmerken uit audiogegevens te extraheren, zoals nuldoorgangssnelheid, spectrale roll-off-frequentie, Mel-frequentie cepstral-coëfficiënten (MFCC), Chroma-frequenties en nog veel meer.