Librosa
Бібліотека Python з відкритим кодом для обробки звуку
Python API, який дозволяє розробникам завантажувати та відтворювати аудіо з диска, обчислювати різноманітні представлення спектрограм та багато іншого.
Librosa — це дуже корисна бібліотека Python для аналізу музики та аудіо, яка допомагає розробникам програмного забезпечення створювати програми для роботи з форматами аудіо та музичних файлів за допомогою Python. Бібліотека дуже проста у використанні та може виконувати як базові, так і складні завдання, пов’язані з обробкою аудіо та музики. Бібліотека має відкритий вихідний код і знаходиться у вільному доступі за ліцензією ISC.
Бібліотека надає велику гнучкість для досвідчених користувачів і водночас чудово підходить для початківців, які більше зацікавлені в обробці аудіофайлів. Бібліотека включає підтримку кількох важливих функцій, пов’язаних з обробкою та вилученням аудіофайлів, таких як завантаження аудіо з диска, обчислення різноманітних представлень спектрограм, поділ джерела гармонійно-перкусії, загальне розкладання спектрограм, завантаження та декодування аудіо, обробка аудіо у часовій області, послідовне моделювання, інтеграція гармонійно-перкусійного розділення, ритм-синхронізація та багато іншого.
Початок роботи з Librosa
Найпростіший спосіб інсталювати Librosa за допомогою індексу пакетів Python (PyPI). Будь ласка, скористайтеся наступною командою для повного встановлення.
Встановіть Librosa за допомогою PyPI
python -m pip install librosa
Завантаження та візуалізація аудіофайлів через Python
Бібліотека Python Librosa дозволяє програмістам програмного забезпечення завантажувати та візуалізувати аудіофайли у власній програмі Python. Перш за все, вам потрібно завантажити аудіофайл і відтворити його за допомогою команди Python у Jupyter Notebook. Далі ви можете легко візуалізувати дискретизований сигнал і побудувати його графік. Ви можете використовувати візуалізацію форми сигналу амплітуди та часу сигналу або також можете використовувати візуалізацію спектрограми або вісь логарифму частоти.
Створення та збереження аудіосигналу через Python
Аналоговий і цифровий сигнали – це різні типи сигналів, які можуть передавати інформацію. Цифровий аудіосигнал — це масив NumPy із заданою частотою та частотою дискретизації. З іншого боку, аналоговий формат хвилі аудіосигналу представляє функцію. Бібліотека Python з відкритим кодом Librosa дає розробникам програмного забезпечення можливість створювати аудіосигнал і зберігати його у вибраному місці за допомогою коду Python.
Витягти аудіофункцію за допомогою Python
Бібліотека Python з відкритим кодом Librosa дає розробникам програмного забезпечення можливість завантажувати та видобувати аудіофункції у своїх власних програмах за допомогою команд Python. Існують різні способи вилучення функцій із аудіоданих, таких як швидкість переходу через нуль, частота спектрального спаду, кепстральні коефіцієнти Mel-частоти (MFCC), частоти кольоровості та багато іншого.