Librosa
Open Source Python-bibliotek til lydbehandling
Python API, der giver udviklere mulighed for at indlæse og afspille lyd fra disk, beregne forskellige spektrogramrepræsentationer og meget mere.
Librosa er et meget nyttigt Python musik- og lydanalysebibliotek, der hjælper softwareudviklere med at bygge applikationer til at arbejde med lyd- og musikfilformater ved hjælp af Python. Biblioteket er meget nemt at bruge og kan håndtere grundlæggende såvel som avancerede opgaver relateret til lyd- og musikbehandling. Biblioteket er open source og er frit tilgængeligt under ISC-licensen.
Biblioteket giver en stor fleksibilitet til ekspertbrugere og samtidig også fantastisk til begynderbrugere, som er mere interesserede i at behandle lydfiler. Biblioteket har inkluderet understøttelse af flere vigtige funktioner relateret til behandling og udtrækning af lydfiler, såsom indlæsning af lyd fra disk, beregning af forskellige spektrogramrepræsentationer, harmonisk-perkussiv kildeadskillelse, generisk spektrogramnedbrydning, indlæser og afkoder lyden, tidsdomænelydbehandling, sekventiel modellering, integration af harmonisk-perkussiv separation, beat-synkron og mange flere.
Kom godt i gang med Librosa
Den nemmeste måde at installere Librosa på er ved at bruge Python Package Index (PyPI). Brug venligst følgende kommando til komplet installation.
Installer Librosa ved hjælp af PyPI
python -m pip install librosa
Indlæsning og visualisering af lydfiler via Python
Python-biblioteket Librosa giver softwareprogrammører mulighed for at indlæse og visualisere lydfiler i deres egen Python-applikation. Først og fremmest skal du indlæse lydfilen og afspille den ved at bruge en Python-kommando i Jupyter Notebook. Dernæst kan du nemt visualisere det samplede signal og plotte det. Du kan bruge bølgeformvisualisering af amplituden vs. tidsrepræsentationen af signalet eller kan også bruge Spectrogramvisualisering eller Log-frekvensakse.
Opret og gem lydsignal via Python
Analoge og digitale signaler er begge forskellige typer signaler, der kan bære information. Et digitalt lydsignal er et NumPy-array med en specificeret frekvens og samplingshastighed. På den anden side repræsenterer det analoge bølgeformat af lydsignalet en funktion. Open source Python-biblioteket Librosa giver softwareudviklere magten til at skabe et lydsignal og gemme det på det sted, de selv vælger ved hjælp af Python-kode.
Udpak lydfunktion ved hjælp af Python
Open source Python-biblioteket Librosa giver softwareudviklere mulighed for at indlæse og udtrække lydfunktioner i deres egne apps ved hjælp af Python-kommandoer. Der er forskellige måder at udtrække funktioner fra lyddata på, såsom nulkrydsningshastighed, spektral roll-off-frekvens, Mel-frekvens cepstralkoefficienter (MFCC), Chroma Frequency og mange flere.