API Node.js ฟรีเพื่อเพิ่มความสามารถ OCR ให้กับโครงการ JavaScript

ไลบรารี OCR Node.js แบบโอเพนซอร์สที่ช่วยให้โปรแกรมเมอร์จดจำและสกัดข้อความจากไฟล์รูปแบบต่าง ๆ รวมถึงภาพ (JPEG, PNG), PDF, และเอกสารได้ฟรีในหลายภาษา

Node-Tesseract-OCR คืออะไร?

ในยุคดิจิทัลสมัยนี้ การสกัดข้อความจากภาพและเอกสารกลายเป็นภารกิจสำคัญในหลายอุตสาหกรรม รวมถึงการจัดการเอกสาร การประมวลผลข้อมูล และปัญญาประดิษฐ์ เทคโนโลยีการจดจำอักขระด้วยแสง (OCR) ทำให้สามารถแปลงเอกสารสแกน ภาพ และ PDF ให้เป็นรูปแบบข้อความที่แก้ไขได้ Node-Tesseract-OCR เป็น API แบบโอเพนซอร์สที่รวมพลังของเครื่องมือ Tesseract OCR เพื่อให้การทำงาน OCR ในแอปพลิเคชัน Node.js เป็นไปอย่างราบรื่นและมีประสิทธิภาพ

Node-Tesseract-OCR เป็น wrapper ของ Node.js สำหรับเครื่องมือ Tesseract OCR ช่วยให้นักพัฒนาซอฟต์แวร์สามารถใช้คุณสมบัติการจดจำข้อความที่ทรงพลังของ Tesseract ภายในสภาพแวดล้อม Node.js API นี้ถูกดูแลที่คลัง GitHub นี้และมีฟังก์ชันหลากหลายที่ทำให้เหมาะกับการใช้งานต่าง ๆ ตั้งแต่การสกัดข้อความอย่างง่ายจนถึงการประมวลผลเอกสารที่ซับซ้อน นักพัฒนาสามารถสกัดข้อความจากภาพและเอกสารหลายภาษา ทำให้เป็นเครื่องมือที่หลากหลายสำหรับการใช้งานต่าง ๆ

API Node-Tesseract-OCR ให้ความสามารถการประมวลผลภาพขั้นสูง รวมถึงการกรองภาพ การปรับขนาด และการครอป เพื่อให้ข้อความที่สกัดออกมามีความแม่นยำและเชื่อถือได้ รองรับกว่า 100 ภาษา ทำให้เป็นโซลูชันที่หลากหลายสำหรับงาน OCR ในสภาพแวดล้อมที่แตกต่างกัน นักพัฒนาสามารถสกัดข้อความจากภาพ, PDF, และเอกสาร และส่งคืนข้อความในรูปแบบต่าง ๆ เช่น JSON, XML, และข้อความธรรมดา ถูกออกแบบให้มีน้ำหนักเบา ยืดหยุ่น และใช้งานง่าย จึงเป็นตัวเลือกที่เหมาะสำหรับนักพัฒนาที่ต้องการเพิ่มความสามารถ OCR ให้กับโครงการของตน ด้วยความสามารถการประมวลผลภาพขั้นสูง การสนับสนุนหลายภาษา และกลไกการจัดการข้อผิดพลาด ทำให้เป็นตัวเลือกที่ดีสำหรับนักพัฒนาที่ต้องการเพิ่ม OCR ให้กับโครงการของตน

ภาพรวม

ภาพรวมของคุณลักษณะของ Node-Tesseract-OCR

Features Overview

ทำ OCR
เพิ่มความสามารถ OCR
จดจำข้อความในภาพ
แปลงภาพที่มีข้อความ
ข้อความแบบฟอนต์ที่จดจำได้
ค้นหา PDF
รองรับกว่า 100 ภาษา
สร้างแอป OCR
บันทึกลงเบราว์เซอร์
สกัดข้อความ
รองรับการทำงานหลายเธรด

Node-Tesseract-OCR

Node-Tesseract-OCR รองรับรูปแบบไฟล์ภาพที่เป็นที่นิยมตามรายการด้านล่าง

Reader

PNG, JPEG, BMP, TIFF, TGA, DICOM

Writer

PNG, JPEG, BMP, TIFF

Node-Tesseract-OCR

ความเป็นอิสระของแพลตฟอร์ม

Node-Tesseract-OCR สามารถทำงานร่วมกับภาษาโปรแกรมใด ๆ ที่ใช้ Java

Java

Node-Tesseract-OCR

เริ่มต้นใช้งาน Node-Tesseract-OCR

วิธีแนะนำในการติดตั้ง Node-Tesseract-OCR คือการใช้ npm โปรดใช้คำสั่งต่อไปนี้เพื่อการติดตั้งที่ราบรื่น

Install Node-Tesseract-OCR via npm

npm install node-tesseract-ocr

คุณสามารถติดตั้งด้วยตนเองได้; ดาวน์โหลดไฟล์เวอร์ชันล่าสุดโดยตรงจาก GitHub repository.

การสกัดข้อความจากภาพใน API Node.js

ไลบรารี Node-Tesseract-OCR แบบโอเพนซอร์สทำให้การพัฒนาซอฟต์แวร์สร้างแอปพลิเคชันที่สกัดข้อความจากภาพโดยอัตโนมัติภายในแอปพลิเคชัน Node.js เป็นเรื่องง่าย รองรับการสกัดข้อความจากเอกสารสแกน, PDF, ภาพจากกล้อง หรือภาพใบเสร็จ ซึ่งมีประโยชน์สำหรับการสร้างคลังข้อมูลที่ค้นหาได้, การทำงานอัตโนมัติของการป้อนข้อมูล, หรือการประมวลผลเอกสารจำนวนมากในภาคการเงินและการดูแลสุขภาพ ตัวอย่างต่อไปนี้แสดงวิธีสกัดข้อความจากภาพภายในแอปพลิเคชัน Node.js อย่างโปรแกรมเมอร์

How to Extract Text from Images inside Node.js Environment?

const tesseract = require("node-tesseract-ocr");

tesseract.recognize("path/to/image.jpg")
  .then(text => {
    console.log("Recognized Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

การเตรียมภาพล่วงหน้าที่ดีกว่าใน Node.js

การเตรียมภาพก่อนทำ OCR สามารถปรับปรุงความแม่นยำของการจดจำข้อความได้อย่างมาก ไลบรารี Node-Tesseract-OCR แบบโอเพนซอร์สอนุญาตให้ใช้เทคนิคการเตรียมภาพพื้นฐาน เช่น การปรับขนาด, การทำไบนารี, และการแก้ไขการเอียง ขั้นตอนเหล่านี้สามารถทำได้ด้วยไลบรารี Node.js เพิ่มเติมอย่าง sharp หรือ jimp ร่วมกับ Node-Tesseract-OCR ตัวอย่างต่อไปนี้แสดงวิธีที่นักพัฒนาซอฟต์แวร์ใช้ขั้นตอนการเตรียมภาพเพื่อปรับปรุงการจดจำ โดยเฉพาะกับภาพคุณภาพต่ำ

How to Apply Preprocessing Steps to Improve Recognition via Node.js API?

const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");

sharp("path/to/input.jpg")
  .resize(800, 600) // Resize the image
  .greyscale() // Convert to greyscale
  .toBuffer()
  .then(data => {
    return tesseract.recognize(data, { lang: "eng" });
  })
  .then(text => {
    console.log("Preprocessed Image Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

ข้อความที่จดจำได้หลายภาษา

หนึ่งในคุณสมบัติที่โดดเด่นของ Node-Tesseract-OCR คือการสนับสนุนหลายภาษาอย่างกว้างขวาง ไลบรารี Tesseract OCR รองรับกว่า 100 ภาษา ทำให้เป็นตัวเลือกที่เหมาะสำหรับแอปพลิเคชันที่ต้องประมวลผลเอกสารหลายภาษา นักพัฒนาสามารถระบุภาษา(ภาษาที่ต้องการ) ที่ต้องการให้ Tesseract ใช้ เพื่อปรับปรุงความแม่นยำของการจดจำข้อความที่ไม่ใช่ภาษาอังกฤษ ตัวอย่างต่อไปนี้แสดงวิธีที่นักพัฒนาสามารถจดจำข้อความในภาษาฝรั่งเศสภายในแอปพลิเคชัน Node.js

How to Recognized Text from Image in French via JavaScript API?

const config = {
  lang: "fra", // French language support
  oem: 1,
  psm: 3
};

tesseract.recognize("path/to/french-text-image.jpg", config)
  .then(text => {
    console.log("Recognized Text in French:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });