Librosa

Biblioteca Python de código abierto para procesamiento de audio

API de Python que permite a los desarrolladores cargar y reproducir audio desde el disco, calcular varias representaciones de espectrogramas y mucho más.

Librosa es una biblioteca de análisis de audio y música de Python muy útil que ayuda a los desarrolladores de software a crear aplicaciones para trabajar con formatos de archivos de audio y música utilizando Python. La biblioteca es muy fácil de usar y puede manejar tareas básicas y avanzadas relacionadas con el procesamiento de audio y música. La biblioteca es de código abierto y está disponible gratuitamente bajo la licencia ISC.

La biblioteca ofrece una gran flexibilidad para los usuarios expertos y, al mismo tiempo, también es increíble para los usuarios principiantes que están más interesados en procesar archivos de audio. La biblioteca ha incluido compatibilidad con varias funciones importantes relacionadas con el procesamiento y la extracción de archivos de audio, como la carga de audio desde el disco, el cálculo de varias representaciones de espectrogramas, la separación de fuentes de percusión armónica, la descomposición de espectrogramas genéricos, la carga y la decodificación del audio, el procesamiento de audio en el dominio del tiempo, modelado secuencial, integrando separación armónico-percusivo, beat-synchronous y muchos más.

de un vistazo

Una descripción general de las características de Librosa.

Descripción de las características

reproducir audio
Visualización de audio
Extraer funciones de audio
Administrar audios
soporte MP3
Sprites de audio
Almacenamiento en caché automático
Borde del mango
Codifica audios
Decodifica audios
Modelado secuencial
Beat-sincrónico

librosa

Librosa admite los formatos de archivo de audio que se enumeran a continuación.

Lector

MP3, WAV, WMA, WEBM

Escritor

MP3, WAV, WMA, WEBM

librosa

Independencia de la plataforma

Librosa solo requiere tiempo de ejecución de Python.

Pitón

librosa

Primeros pasos con Librosa

La forma más fácil de instalar Librosa es usando el índice de paquetes de Python (PyPI). Utilice el siguiente comando para completar la instalación.

Instalar Librosa usando PyPI

 python -m pip install librosa

Cargar y visualizar archivos de audio a través de Python

La biblioteca Python Librosa permite a los programadores de software cargar y visualizar archivos de audio dentro de su propia aplicación Python. En primer lugar, debe cargar el archivo de audio y reproducirlo mediante un comando de Python en Jupyter Notebook. A continuación, puede visualizar fácilmente la señal muestreada y trazarla. Puede usar la visualización de forma de onda de la representación de amplitud frente al tiempo de la señal o también puede usar la visualización de espectrograma o el eje de frecuencia logarítmica.

Crear y guardar señales de audio a través de Python

Las señales analógicas y digitales son tipos diferentes de señales que pueden transportar información. Una señal de audio digital es una matriz NumPy con una frecuencia y una frecuencia de muestreo específicas. Por otro lado, el formato de onda analógica de la señal de audio representa una función. La biblioteca Python de código abierto Librosa brinda a los desarrolladores de software el poder de crear una señal de audio y guardarla en el lugar que elijan utilizando el código Python.

Extraer función de audio usando Python

La biblioteca Python de código abierto Librosa brinda a los desarrolladores de software la capacidad de cargar y extraer funciones de audio dentro de sus propias aplicaciones mediante comandos de Python. Hay varias formas de extraer características de los datos de audio, como la tasa de cruce por cero, la frecuencia de caída espectral, los coeficientes cepstrales de frecuencia Mel (MFCC), las frecuencias cromáticas y muchas más.