1. Produkter
  2.   Lyd
  3.   Python
  4.   Librosa 

Librosa 

 
 

Åpen kildekode Python-bibliotek for lydbehandling

Python API som lar utviklere laste og spille av lyd fra disk, beregne ulike spektrogramrepresentasjoner og mye mer.

Librosa er et veldig nyttig Python musikk- og lydanalysebibliotek som hjelper programvareutviklere med å bygge applikasjoner for å jobbe med lyd- og musikkfilformater ved hjelp av Python. Biblioteket er veldig enkelt å bruke og kan håndtere grunnleggende så vel som avanserte oppgaver knyttet til lyd- og musikkbehandling. Biblioteket er åpen kildekode og er fritt tilgjengelig under ISC-lisensen.

Biblioteket gir stor fleksibilitet til ekspertbrukere og samtidig fantastisk for nybegynnere som er mer interessert i å behandle lydfiler. Biblioteket har inkludert støtte for flere viktige funksjoner knyttet til behandling og utvinning av lydfiler, for eksempel lasting av lyd fra disk, databehandling av ulike spektrogramrepresentasjoner, harmonisk-perkussiv kildeseparasjon, generisk spektrogramdekomponering, laster og dekoder lyden, lydbehandling i tidsdomene, sekvensiell modellering, integrering av harmonisk-perkussiv separasjon, beat-synkron og mange flere.

Previous Next

Komme i gang med Librosa 

Den enkleste måten å installere Librosa på er ved å bruke Python Package Index (PyPI). Bruk følgende kommando for fullstendig installasjon.

Installer Librosa med PyPI

 python -m pip install librosa 

Laste og visualisere lydfiler via Python

Python-biblioteket Librosa lar programvareprogrammerere laste og visualisere lydfiler i deres egen Python-applikasjon. Først av alt må du laste inn lydfilen og spille den av ved å bruke en Python-kommando i Jupyter Notebook. Deretter kan du enkelt visualisere det samplede signalet og plotte det. Du kan bruke bølgeformvisualisering av amplituden vs. tidsrepresentasjonen av signalet, eller du kan også bruke spektrogramvisualisering eller Log-frekvensakse.

Opprett og lagre lydsignal via Python

Analoge og digitale signaler er begge forskjellige typer signaler som kan bære informasjon. Et digitalt lydsignal er et NumPy-array med en spesifisert frekvens og samplingshastighet. På den annen side representerer det analoge bølgeformatet til lydsignalet en funksjon. Python-biblioteket med åpen kildekode Librosa gir programvareutviklere muligheten til å lage et lydsignal og lagre det på stedet de velger ved hjelp av Python-kode.

Pakk ut lydfunksjonen ved hjelp av Python

Python-biblioteket Librosa med åpen kildekode gir programvareutviklere muligheten til å laste og trekke ut lydfunksjoner i sine egne apper ved hjelp av Python-kommandoer. Det er forskjellige måter å trekke ut funksjoner fra lyddata, for eksempel nullkrysshastighet, spektral avrullingsfrekvens, Mel-frekvens cepstrale koeffisienter (MFCC), Chroma Frequency, og mange flere.

 Norsk