Librosa

Perpustakaan Python Sumber Terbuka untuk Pemprosesan Audio

API Python yang membolehkan pembangun memuatkan dan memainkan audio daripada cakera, mengira pelbagai perwakilan spektrogram dan banyak lagi.

Librosa ialah pustaka analisis muzik dan audio Python yang sangat berguna yang membantu pembangun perisian membina aplikasi untuk bekerja dengan format fail audio dan muzik menggunakan Python. Perpustakaan ini sangat mudah digunakan dan boleh mengendalikan tugasan asas serta lanjutan yang berkaitan dengan pemprosesan audio dan muzik. Perpustakaan ini adalah sumber terbuka dan boleh didapati secara percuma di bawah Lesen ISC.

Perpustakaan ini menyediakan banyak fleksibiliti kepada pengguna pakar dan pada masa yang sama juga hebat kepada pengguna pemula yang lebih berminat untuk memproses fail audio. Perpustakaan telah menyertakan sokongan untuk beberapa ciri penting yang berkaitan dengan pemprosesan dan pengekstrakan fail audio seperti memuatkan audio daripada cakera, mengira pelbagai perwakilan spektrogram, pemisahan sumber perkusi-harmonik, penguraian spektrogram generik, memuatkan dan menyahkod audio, pemprosesan audio domain masa, pemodelan berjujukan, menyepadukan pemisahan harmonik-perkusi, rentak-segerak dan banyak lagi.

Sekali pandang

Gambaran keseluruhan ciri Librosa.

Gambaran Keseluruhan Ciri

Mainkan audio
Visualisasi audio
Ekstrak ciri audio
Urus audio
Sokongan MP3
Sprite Audio
Auto caching
Mengendalikan tepi
Mengekod audio
Menyahkod audio
Pemodelan berurutan
Pukul-segerak

Librosa

Librosa menyokong format fail Audio seperti yang disenaraikan di bawah.

Pembaca

MP3, WAV, WMA, WEBM

Penulis

MP3, WAV, WMA, WEBM

Librosa

Kemerdekaan Platform

Librosa hanya memerlukan masa jalanan Python.

Ular sawa

Librosa

Bermula dengan Librosa

Cara paling mudah untuk memasang Librosa ialah dengan menggunakan Indeks Pakej Python (PyPI). Sila gunakan arahan berikut untuk pemasangan lengkap.

Pasang Librosa menggunakan PyPI

 python -m pip install librosa

Memuatkan dan Memvisualisasikan Fail Audio melalui Python

Perpustakaan Python Librosa membenarkan pengaturcara perisian untuk memuatkan dan memvisualisasikan fail audio di dalam aplikasi Python mereka sendiri. Pertama sekali, anda perlu memuatkan fail audio dan memainkannya dengan menggunakan arahan Python dalam Jupyter Notebook. Seterusnya, anda boleh memvisualisasikan isyarat sampel dengan mudah dan merancangnya. Anda boleh menggunakan visualisasi bentuk gelombang amplitud berbanding perwakilan masa isyarat atau boleh juga menggunakan visualisasi Spektrogram atau paksi frekuensi Log.

Cipta dan Simpan Isyarat Audio melalui Python

Isyarat analog dan digital adalah kedua-dua jenis isyarat berbeza yang boleh membawa maklumat. Isyarat audio digital ialah tatasusunan NumPy dengan frekuensi dan kadar sampel yang ditentukan. Sebaliknya, format gelombang analog bagi isyarat audio mewakili fungsi. Pustaka Python sumber terbuka Librosa memberikan pembangun perisian kuasa untuk mencipta isyarat audio dan menyimpannya ke tempat pilihan mereka menggunakan kod Python.

Ekstrak Ciri Audio menggunakan Python

Pustaka Python sumber terbuka Librosa memberikan pembangun perisian keupayaan untuk memuatkan dan mengekstrak ciri audio dalam aplikasi mereka sendiri menggunakan arahan Python. Terdapat pelbagai cara untuk mengekstrak ciri daripada data audio, seperti kadar silangan sifar, frekuensi roll-off spektrum, pekali cepstral frekuensi Mel (MFCC), Frekuensi Chroma dan banyak lagi.