Librosa
Perpustakaan Python Sumber Terbuka untuk Pemprosesan Audio
API Python yang membolehkan pembangun memuatkan dan memainkan audio daripada cakera, mengira pelbagai perwakilan spektrogram dan banyak lagi.
Librosa ialah pustaka analisis muzik dan audio Python yang sangat berguna yang membantu pembangun perisian membina aplikasi untuk bekerja dengan format fail audio dan muzik menggunakan Python. Perpustakaan ini sangat mudah digunakan dan boleh mengendalikan tugasan asas serta lanjutan yang berkaitan dengan pemprosesan audio dan muzik. Perpustakaan ini adalah sumber terbuka dan boleh didapati secara percuma di bawah Lesen ISC.
Perpustakaan ini menyediakan banyak fleksibiliti kepada pengguna pakar dan pada masa yang sama juga hebat kepada pengguna pemula yang lebih berminat untuk memproses fail audio. Perpustakaan telah menyertakan sokongan untuk beberapa ciri penting yang berkaitan dengan pemprosesan dan pengekstrakan fail audio seperti memuatkan audio daripada cakera, mengira pelbagai perwakilan spektrogram, pemisahan sumber perkusi-harmonik, penguraian spektrogram generik, memuatkan dan menyahkod audio, pemprosesan audio domain masa, pemodelan berjujukan, menyepadukan pemisahan harmonik-perkusi, rentak-segerak dan banyak lagi.
Bermula dengan Librosa
Cara paling mudah untuk memasang Librosa ialah dengan menggunakan Indeks Pakej Python (PyPI). Sila gunakan arahan berikut untuk pemasangan lengkap.
Pasang Librosa menggunakan PyPI
python -m pip install librosa
Memuatkan dan Memvisualisasikan Fail Audio melalui Python
Perpustakaan Python Librosa membenarkan pengaturcara perisian untuk memuatkan dan memvisualisasikan fail audio di dalam aplikasi Python mereka sendiri. Pertama sekali, anda perlu memuatkan fail audio dan memainkannya dengan menggunakan arahan Python dalam Jupyter Notebook. Seterusnya, anda boleh memvisualisasikan isyarat sampel dengan mudah dan merancangnya. Anda boleh menggunakan visualisasi bentuk gelombang amplitud berbanding perwakilan masa isyarat atau boleh juga menggunakan visualisasi Spektrogram atau paksi frekuensi Log.
Cipta dan Simpan Isyarat Audio melalui Python
Isyarat analog dan digital adalah kedua-dua jenis isyarat berbeza yang boleh membawa maklumat. Isyarat audio digital ialah tatasusunan NumPy dengan frekuensi dan kadar sampel yang ditentukan. Sebaliknya, format gelombang analog bagi isyarat audio mewakili fungsi. Pustaka Python sumber terbuka Librosa memberikan pembangun perisian kuasa untuk mencipta isyarat audio dan menyimpannya ke tempat pilihan mereka menggunakan kod Python.
Ekstrak Ciri Audio menggunakan Python
Pustaka Python sumber terbuka Librosa memberikan pembangun perisian keupayaan untuk memuatkan dan mengekstrak ciri audio dalam aplikasi mereka sendiri menggunakan arahan Python. Terdapat pelbagai cara untuk mengekstrak ciri daripada data audio, seperti kadar silangan sifar, frekuensi roll-off spektrum, pekali cepstral frekuensi Mel (MFCC), Frekuensi Chroma dan banyak lagi.