Librosa
ऑडियो प्रोसेसिंग के लिए ओपन सोर्स पायथन लाइब्रेरी
पायथन एपीआई जो डेवलपर्स को डिस्क से ऑडियो लोड करने और चलाने की अनुमति देता है, विभिन्न स्पेक्ट्रोग्राम अभ्यावेदन की गणना करता है, और बहुत कुछ।
लिब्रोसा एक बहुत ही उपयोगी पायथन संगीत और ऑडियो विश्लेषण पुस्तकालय है जो सॉफ्टवेयर डेवलपर्स को पायथन का उपयोग करके ऑडियो और संगीत फ़ाइल स्वरूपों के साथ काम करने के लिए एप्लिकेशन बनाने में मदद करता है। पुस्तकालय का उपयोग करना बहुत आसान है और ऑडियो और संगीत प्रसंस्करण से संबंधित बुनियादी और साथ ही उन्नत कार्यों को संभाल सकता है। पुस्तकालय खुला स्रोत है और आईएससी लाइसेंस के तहत स्वतंत्र रूप से उपलब्ध है।
पुस्तकालय विशेषज्ञ उपयोगकर्ताओं को बहुत अधिक लचीलापन प्रदान करता है और साथ ही शुरुआती उपयोगकर्ताओं के लिए भी बढ़िया है जो ऑडियो फाइलों को संसाधित करने में अधिक रुचि रखते हैं। पुस्तकालय में ऑडियो फाइलों के प्रसंस्करण और निष्कर्षण से संबंधित कई महत्वपूर्ण विशेषताओं के लिए समर्थन शामिल है जैसे डिस्क से लोड ऑडियो, विभिन्न स्पेक्ट्रोग्राम अभ्यावेदन की गणना, हार्मोनिक-टक्कर स्रोत पृथक्करण, जेनेरिक स्पेक्ट्रोग्राम अपघटन, ऑडियो को लोड और डिकोड करता है, टाइम-डोमेन ऑडियो प्रोसेसिंग, अनुक्रमिक मॉडलिंग, हार्मोनिक-टक्कर सेपरेशन को एकीकृत करना, बीट-सिंक्रोनस और कई अन्य।
लिब्रोसा के साथ शुरुआत करना
Librosa को स्थापित करने का सबसे आसान तरीका Python Package Index (PyPI) का उपयोग करना है। पूर्ण स्थापना के लिए कृपया निम्न आदेश का उपयोग करें।
PyPI का उपयोग करके लिब्रोसा स्थापित करें
python -m pip install librosa
पायथन के माध्यम से ऑडियो फाइलों को लोड और विज़ुअलाइज़ करना
पायथन पुस्तकालय लिब्रोसा सॉफ्टवेयर प्रोग्रामर को अपने स्वयं के पायथन एप्लिकेशन के अंदर ऑडियो फाइलों को लोड और विज़ुअलाइज़ करने की अनुमति देता है। सबसे पहले, आपको ऑडियो फ़ाइल को लोड करना होगा और इसे ज्यूपिटर नोटबुक में पायथन कमांड का उपयोग करके चलाना होगा। इसके बाद, आप आसानी से नमूना संकेत की कल्पना कर सकते हैं और इसे प्लॉट कर सकते हैं। आप आयाम बनाम सिग्नल के समय प्रतिनिधित्व के तरंग दृश्य का उपयोग कर सकते हैं या स्पेक्ट्रोग्राम विज़ुअलाइज़ेशन या लॉग-फ़्रीक्वेंसी अक्ष का भी उपयोग कर सकते हैं।
पायथन के माध्यम से ऑडियो सिग्नल बनाएं और सहेजें
एनालॉग और डिजिटल सिग्नल दोनों अलग-अलग प्रकार के सिग्नल हैं जो सूचना ले जा सकते हैं। एक डिजिटल ऑडियो सिग्नल एक निर्दिष्ट आवृत्ति और नमूना दर के साथ एक NumPy सरणी है। दूसरी ओर, ऑडियो सिग्नल का एनालॉग तरंग प्रारूप एक फ़ंक्शन का प्रतिनिधित्व करता है। ओपन सोर्स पायथन लाइब्रेरी लिब्रोसा सॉफ्टवेयर डेवलपर्स को एक ऑडियो सिग्नल बनाने और इसे पायथन कोड का उपयोग करके अपनी पसंद के स्थान पर सहेजने की शक्ति देता है।
पायथन का उपयोग करके ऑडियो फ़ीचर निकालें
ओपन सोर्स पायथन लाइब्रेरी लिब्रोसा सॉफ्टवेयर डेवलपर्स को पायथन कमांड का उपयोग करके अपने स्वयं के ऐप के अंदर ऑडियो सुविधाओं को लोड और निकालने की क्षमता देता है। ऑडियो डेटा से सुविधाओं को निकालने के कई तरीके हैं, जैसे कि जीरो-क्रॉसिंग रेट, स्पेक्ट्रल रोल-ऑफ फ़्रीक्वेंसी, मेल-फ़्रीक्वेंसी सेप्स्ट्रल गुणांक (एमएफसीसी), क्रोमा फ़्रीक्वेंसी, और बहुत कुछ।