Librosa 

 
 

Open Source Python Library สำหรับการประมวลผลเสียง

Python API ที่ช่วยให้นักพัฒนาสามารถโหลดและเล่นเสียงจากดิสก์ คำนวณการแสดงสเปกโตรแกรมต่างๆ และอีกมากมาย

Librosa เป็นไลบรารีเพลงและเสียงของ Python ที่มีประโยชน์มาก ซึ่งช่วยให้นักพัฒนาซอฟต์แวร์สร้างแอปพลิเคชันสำหรับการทำงานกับรูปแบบไฟล์เสียงและเพลงโดยใช้ Python ไลบรารีนี้ใช้งานง่ายมาก และสามารถจัดการงานพื้นฐานและงานขั้นสูงที่เกี่ยวข้องกับการประมวลผลเสียงและเพลงได้ ห้องสมุดเป็นโอเพ่นซอร์สและสามารถใช้ได้ฟรีภายใต้ใบอนุญาต ISC

ไลบรารี่ให้ความยืดหยุ่นอย่างมากแก่ผู้ใช้ที่เชี่ยวชาญ และในขณะเดียวกันก็ยอดเยี่ยมสำหรับผู้ใช้มือใหม่ที่สนใจในการประมวลผลไฟล์เสียงมากกว่า ไลบรารีได้รวมการรองรับคุณสมบัติที่สำคัญหลายอย่างที่เกี่ยวข้องกับการประมวลผลไฟล์เสียงและการดึงข้อมูล เช่น โหลดเสียงจากดิสก์, คำนวณการแสดงสเปกตรัมต่างๆ, การแยกแหล่งฮาร์โมนิก-เพอร์คัสซีฟ, การสลายตัวของสเปกตรัมทั่วไป, โหลดและถอดรหัสเสียง, การประมวลผลเสียงในโดเมนเวลา การสร้างแบบจำลองตามลำดับ การรวมการแยกฮาร์โมนิก-เพอร์คัสซีฟ บีต-ซิงโครนัส และอื่นๆ อีกมากมาย

Previous Next

เริ่มต้นกับ Librosa 

วิธีที่ง่ายที่สุดในการติดตั้ง Librosa คือการใช้ Python Package Index (PyPI) โปรดใช้คำสั่งต่อไปนี้เพื่อการติดตั้งที่สมบูรณ์

ติดตั้ง Librosa โดยใช้ PyPI

 python -m pip install librosa 

การโหลดและการแสดงไฟล์เสียงผ่าน Python

ไลบรารี Python Librosa ช่วยให้โปรแกรมเมอร์ซอฟต์แวร์สามารถโหลดและแสดงภาพไฟล์เสียงภายในแอปพลิเคชัน Python ของตนเองได้ ก่อนอื่น คุณต้องโหลดไฟล์เสียงและเล่นโดยใช้คำสั่ง Python ใน Jupyter Notebook ถัดไป คุณสามารถเห็นภาพสัญญาณที่สุ่มตัวอย่างและพล็อตสัญญาณได้อย่างง่ายดาย คุณสามารถใช้การแสดงภาพรูปคลื่นของแอมพลิจูดเทียบกับการแสดงเวลาของสัญญาณ หรือใช้การแสดงภาพสเปกโตรแกรมหรือแกนความถี่บันทึกได้

สร้างและบันทึกสัญญาณเสียงผ่าน Python

สัญญาณอนาล็อกและดิจิตอลเป็นสัญญาณประเภทต่างๆ ที่สามารถส่งข้อมูลได้ สัญญาณเสียงดิจิตอลคืออาร์เรย์ NumPy ที่มีความถี่และอัตราการสุ่มตัวอย่างที่ระบุ ในทางกลับกัน รูปแบบคลื่นแอนะล็อกของสัญญาณเสียงแสดงถึงฟังก์ชัน ไลบรารี Python แบบโอเพ่นซอร์ส Librosa ช่วยให้นักพัฒนาซอฟต์แวร์สามารถสร้างสัญญาณเสียงและบันทึกลงในที่ที่พวกเขาเลือกโดยใช้โค้ด Python

แยกคุณสมบัติเสียงโดยใช้ Python

ไลบรารี Python แบบโอเพนซอร์ส Librosa ช่วยให้นักพัฒนาซอฟต์แวร์สามารถโหลดและแยกคุณลักษณะด้านเสียงภายในแอปของตนเองได้โดยใช้คำสั่ง Python มีหลายวิธีในการดึงข้อมูลคุณลักษณะจากข้อมูลเสียง เช่น อัตราการข้ามศูนย์ ความถี่การหมุนสเปกตรัม ค่าสัมประสิทธิ์ของความถี่ Mel-frequency (MFCC) ความถี่ Chroma และอื่นๆ อีกมากมาย

 ไทย