API Node.js ฟรีเพื่อเพิ่มความสามารถ OCR ให้กับโครงการ JavaScript
ไลบรารี OCR Node.js แบบโอเพนซอร์สที่ช่วยให้โปรแกรมเมอร์จดจำและสกัดข้อความจากไฟล์รูปแบบต่าง ๆ รวมถึงภาพ (JPEG, PNG), PDF, และเอกสารได้ฟรีในหลายภาษา
Node-Tesseract-OCR คืออะไร?
ในยุคดิจิทัลสมัยนี้ การสกัดข้อความจากภาพและเอกสารกลายเป็นภารกิจสำคัญในหลายอุตสาหกรรม รวมถึงการจัดการเอกสาร การประมวลผลข้อมูล และปัญญาประดิษฐ์ เทคโนโลยีการจดจำอักขระด้วยแสง (OCR) ทำให้สามารถแปลงเอกสารสแกน ภาพ และ PDF ให้เป็นรูปแบบข้อความที่แก้ไขได้ Node-Tesseract-OCR เป็น API แบบโอเพนซอร์สที่รวมพลังของเครื่องมือ Tesseract OCR เพื่อให้การทำงาน OCR ในแอปพลิเคชัน Node.js เป็นไปอย่างราบรื่นและมีประสิทธิภาพ
Node-Tesseract-OCR เป็น wrapper ของ Node.js สำหรับเครื่องมือ Tesseract OCR ช่วยให้นักพัฒนาซอฟต์แวร์สามารถใช้คุณสมบัติการจดจำข้อความที่ทรงพลังของ Tesseract ภายในสภาพแวดล้อม Node.js API นี้ถูกดูแลที่คลัง GitHub นี้และมีฟังก์ชันหลากหลายที่ทำให้เหมาะกับการใช้งานต่าง ๆ ตั้งแต่การสกัดข้อความอย่างง่ายจนถึงการประมวลผลเอกสารที่ซับซ้อน นักพัฒนาสามารถสกัดข้อความจากภาพและเอกสารหลายภาษา ทำให้เป็นเครื่องมือที่หลากหลายสำหรับการใช้งานต่าง ๆ
API Node-Tesseract-OCR ให้ความสามารถการประมวลผลภาพขั้นสูง รวมถึงการกรองภาพ การปรับขนาด และการครอป เพื่อให้ข้อความที่สกัดออกมามีความแม่นยำและเชื่อถือได้ รองรับกว่า 100 ภาษา ทำให้เป็นโซลูชันที่หลากหลายสำหรับงาน OCR ในสภาพแวดล้อมที่แตกต่างกัน นักพัฒนาสามารถสกัดข้อความจากภาพ, PDF, และเอกสาร และส่งคืนข้อความในรูปแบบต่าง ๆ เช่น JSON, XML, และข้อความธรรมดา ถูกออกแบบให้มีน้ำหนักเบา ยืดหยุ่น และใช้งานง่าย จึงเป็นตัวเลือกที่เหมาะสำหรับนักพัฒนาที่ต้องการเพิ่มความสามารถ OCR ให้กับโครงการของตน ด้วยความสามารถการประมวลผลภาพขั้นสูง การสนับสนุนหลายภาษา และกลไกการจัดการข้อผิดพลาด ทำให้เป็นตัวเลือกที่ดีสำหรับนักพัฒนาที่ต้องการเพิ่ม OCR ให้กับโครงการของตน
เริ่มต้นใช้งาน Node-Tesseract-OCR
วิธีแนะนำในการติดตั้ง Node-Tesseract-OCR คือการใช้ npm โปรดใช้คำสั่งต่อไปนี้เพื่อการติดตั้งที่ราบรื่น
Install Node-Tesseract-OCR via npm
npm install node-tesseract-ocr คุณสามารถติดตั้งด้วยตนเองได้; ดาวน์โหลดไฟล์เวอร์ชันล่าสุดโดยตรงจาก GitHub repository.
การสกัดข้อความจากภาพใน API Node.js
ไลบรารี Node-Tesseract-OCR แบบโอเพนซอร์สทำให้การพัฒนาซอฟต์แวร์สร้างแอปพลิเคชันที่สกัดข้อความจากภาพโดยอัตโนมัติภายในแอปพลิเคชัน Node.js เป็นเรื่องง่าย รองรับการสกัดข้อความจากเอกสารสแกน, PDF, ภาพจากกล้อง หรือภาพใบเสร็จ ซึ่งมีประโยชน์สำหรับการสร้างคลังข้อมูลที่ค้นหาได้, การทำงานอัตโนมัติของการป้อนข้อมูล, หรือการประมวลผลเอกสารจำนวนมากในภาคการเงินและการดูแลสุขภาพ ตัวอย่างต่อไปนี้แสดงวิธีสกัดข้อความจากภาพภายในแอปพลิเคชัน Node.js อย่างโปรแกรมเมอร์
How to Extract Text from Images inside Node.js Environment?
const tesseract = require("node-tesseract-ocr");
tesseract.recognize("path/to/image.jpg")
.then(text => {
console.log("Recognized Text:", text);
})
.catch(error => {
console.error("Error:", error.message);
});
การเตรียมภาพล่วงหน้าที่ดีกว่าใน Node.js
การเตรียมภาพก่อนทำ OCR สามารถปรับปรุงความแม่นยำของการจดจำข้อความได้อย่างมาก ไลบรารี Node-Tesseract-OCR แบบโอเพนซอร์สอนุญาตให้ใช้เทคนิคการเตรียมภาพพื้นฐาน เช่น การปรับขนาด, การทำไบนารี, และการแก้ไขการเอียง ขั้นตอนเหล่านี้สามารถทำได้ด้วยไลบรารี Node.js เพิ่มเติมอย่าง sharp หรือ jimp ร่วมกับ Node-Tesseract-OCR ตัวอย่างต่อไปนี้แสดงวิธีที่นักพัฒนาซอฟต์แวร์ใช้ขั้นตอนการเตรียมภาพเพื่อปรับปรุงการจดจำ โดยเฉพาะกับภาพคุณภาพต่ำ
How to Apply Preprocessing Steps to Improve Recognition via Node.js API?
const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");
sharp("path/to/input.jpg")
.resize(800, 600) // Resize the image
.greyscale() // Convert to greyscale
.toBuffer()
.then(data => {
return tesseract.recognize(data, { lang: "eng" });
})
.then(text => {
console.log("Preprocessed Image Text:", text);
})
.catch(error => {
console.error("Error:", error.message);
});
ข้อความที่จดจำได้หลายภาษา
หนึ่งในคุณสมบัติที่โดดเด่นของ Node-Tesseract-OCR คือการสนับสนุนหลายภาษาอย่างกว้างขวาง ไลบรารี Tesseract OCR รองรับกว่า 100 ภาษา ทำให้เป็นตัวเลือกที่เหมาะสำหรับแอปพลิเคชันที่ต้องประมวลผลเอกสารหลายภาษา นักพัฒนาสามารถระบุภาษา(ภาษาที่ต้องการ) ที่ต้องการให้ Tesseract ใช้ เพื่อปรับปรุงความแม่นยำของการจดจำข้อความที่ไม่ใช่ภาษาอังกฤษ ตัวอย่างต่อไปนี้แสดงวิธีที่นักพัฒนาสามารถจดจำข้อความในภาษาฝรั่งเศสภายในแอปพลิเคชัน Node.js
How to Recognized Text from Image in French via JavaScript API?
const config = {
lang: "fra", // French language support
oem: 1,
psm: 3
};
tesseract.recognize("path/to/french-text-image.jpg", config)
.then(text => {
console.log("Recognized Text in French:", text);
})
.catch(error => {
console.error("Error:", error.message);
});