Librosa

오디오 처리를 위한 오픈 소스 Python 라이브러리

개발자가 디스크에서 오디오를 로드 및 재생하고 다양한 스펙트로그램 표현 등을 계산할 수 있도록 하는 Python API.

Librosa는 소프트웨어 개발자가 Python을 사용하여 오디오 및 음악 파일 형식 작업을 위한 응용 프로그램을 빌드하는 데 도움이 되는 매우 유용한 Python 음악 및 오디오 분석 라이브러리입니다. 라이브러리는 사용이 매우 간편하며 오디오 및 음악 처리와 관련된 기본 및 고급 작업을 처리할 수 있습니다. 라이브러리는 오픈 소스이며 ISC 라이선스에 따라 무료로 사용할 수 있습니다.

라이브러리는 전문 사용자에게 상당한 유연성을 제공하는 동시에 오디오 파일 처리에 더 관심이 있는 초보자 사용자에게도 매우 유용합니다. 라이브러리에는 디스크에서 오디오 로드, 다양한 스펙트로그램 표현 계산, 조화-타악 소스 분리, 일반 스펙트로그램 분해, 오디오 로드 및 디코딩, 시간 도메인 오디오 처리, 순차 모델링, 조화-타악기 분리, 비트 동기식 통합 등.

한눈에

Librosa 기능의 개요입니다.

기능 개요

오디오 재생
오디오 시각화
오디오 기능 추출
오디오 관리
MP3 지원
오디오 스프라이트
자동 캐싱
손잡이 가장자리
오디오 인코딩
오디오 디코딩
순차 모델링
비트 동기

리브로사

Librosa는 아래 나열된 오디오 파일 형식을 지원합니다.

리더

MP3, WAV, WMA, WEBM

작가

MP3, WAV, WMA, WEBM

리브로사

플랫폼 독립성

Librosa에는 Python 런타임만 필요합니다.

파이썬

리브로사

리브로사 시작하기

Librosa를 설치하는 가장 쉬운 방법은 Python 패키지 색인(PyPI)을 사용하는 것입니다. 전체 설치를 위해 다음 명령을 사용하십시오.

PyPI를 사용하여 Librosa 설치

 python -m pip install librosa

Python을 통해 오디오 파일 로드 및 시각화

Python 라이브러리 Librosa를 사용하면 소프트웨어 프로그래머가 자체 Python 응용 프로그램 내에서 오디오 파일을 로드하고 시각화할 수 있습니다. 우선 Jupyter Notebook에서 Python 명령을 사용하여 오디오 파일을 로드하고 재생해야 합니다. 다음으로 샘플링된 신호를 쉽게 시각화하고 플롯할 수 있습니다. 신호의 진폭 대 시간 표현의 파형 시각화를 사용하거나 스펙트로그램 시각화 또는 로그 주파수 축을 사용할 수도 있습니다.

Python을 통해 오디오 신호 생성 및 저장

아날로그 및 디지털 신호는 정보를 전달할 수 있는 서로 다른 유형의 신호입니다. 디지털 오디오 신호는 지정된 주파수와 샘플 레이트를 가진 NumPy 배열입니다. 반면에 오디오 신호의 아날로그 웨이브 형식은 기능을 나타냅니다. 오픈 소스 Python 라이브러리 Librosa는 소프트웨어 개발자에게 오디오 신호를 생성하고 Python 코드를 사용하여 선택한 위치에 저장할 수 있는 기능을 제공합니다.

Python을 사용하여 오디오 기능 추출

오픈 소스 Python 라이브러리 Librosa는 소프트웨어 개발자에게 Python 명령을 사용하여 자체 앱 내에서 오디오 기능을 로드하고 추출할 수 있는 기능을 제공합니다. 제로 교차 속도, 스펙트럼 롤오프 주파수, MFCC(Mel-frequency cepstral coefficients), 크로마 주파수 등과 같은 오디오 데이터에서 특징을 추출하는 다양한 방법이 있습니다.