ไลบรารี PHP เพื่อดึงข้อความจากรูปภาพในหลายภาษา

API การจดจำอักขระด้วยแสง (OCR) PHP แบบโอเพ่นซอร์สที่อนุญาตให้โหลดและสแกนรูปภาพหรือเอกสาร, จดจำและดึงข้อความจากรูปภาพในหลายภาษาในแอป PHP.

เทคโนโลยีการจดจำอักขระด้วยแสง (OCR) ได้กลายเป็นเครื่องมือสำคัญสำหรับการสกัดข้อความจากรูปภาพและเอกสารในปัจจุบัน ด้วยการเร่งรัดของการเปลี่ยนแปลงสู่ดิจิทัล ความต้องการโซลูชัน OCR ที่มีประสิทธิภาพและแม่นยำจึงเพิ่มสูงขึ้นอย่างไม่เคยมีมาก่อน OcrPHP เป็นไลบรารี OCR โอเพ่นซอร์สที่ทรงพลังซึ่งช่วยให้นักพัฒนาซอฟต์แวร์สามารถสร้างแอปพลิเคชัน OCR ที่แข็งแกร่งและขยายได้ มันเป็นไลบรารี OCR ที่เขียนด้วย PHP ซึ่งใช้เอนจิน Tesseract OCR ซึ่งเป็นเทคโนโลยี OCR ที่ได้รับการใช้งานอย่างกว้างขวางและได้รับการยอมรับสูงจาก Google ไลบรารีนี้มีคุณสมบัติมากมาย เช่น การสแกนเอกสาร, การสกัดข้อความจากรูปภาพ, การสกัดข้อความในภาษาที่ระบุ, การสกัดข้อความจากไฟล์ PDF และอื่นๆ อีกหลายอย่าง

ไลบรารี OcrPHP ได้รวมเทคนิคการเตรียมภาพขั้นสูง เช่น การแก้ไขการเอียง, การกำจัดจุดรบกวน, และการทำไบนารี เพื่อปรับปรุงความแม่นยำของ OCR นอกจากนี้ยังรองรับการทำ OCR ในหลายภาษา รวมถึงอังกฤษ, สเปน, ฝรั่งเศส, เยอรมัน, อิตาลี, โปรตุเกส, จีน, ญี่ปุ่น และอื่นๆ อีกหลายภาษา นักพัฒนาซอฟต์แวร์สามารถปรับแต่งกระบวนการ OCR ได้โดยการตั้งค่าพารามิเตอร์ต่างๆ เช่น ภาษา, โหมดการแบ่งหน้า, และการตั้งค่าเอนจิน OCR อีกทั้งยังมีกลไกการจัดการข้อผิดพลาดที่แข็งแกร่งเพื่อให้การดำเนินการ OCR ทำงานได้อย่างราบรื่นและมีประสิทธิภาพ ด้วยคุณสมบัติเช่น การสนับสนุนหลายภาษา, การสแกนภาพขั้นสูง, การกำหนดค่าที่กำหนดเอง, และการบูรณาการที่ง่ายดาย ทำให้ผู้พัฒนาสามารถสร้างเครื่องมือจดจำข้อความที่หลากหลายได้ด้วยความพยายามน้อยและต้นทุนต่ำ

Previous Next

เริ่มต้นใช้งาน OcrPHP

วิธีที่แนะนำในการติดตั้ง OcrPHP คือการใช้ Composer. โปรดใช้คำสั่งต่อไปนี้เพื่อการติดตั้งที่ราบรื่น

Install OcrPHP via Composer

composer require fizzday/ocrphp

Install OcrPHP via Github

git clone https://github.com/fizzday/OcrPHP.git 

คุณสามารถดาวน์โหลดไลบรารีที่คอมไพล์แล้วจาก Github repository.

จดจำและสกัดข้อความจากรูปภาพด้วย PHP

ไลบรารี OcrPHP แบบโอเพ่นซอร์สทำให้ซอฟต์แวร์สามารถโหลดรูปภาพหลายประเภทและสกัดข้อความจากรูปภาพเหล่านั้นได้ด้วยเพียงไม่กี่บรรทัดของโค้ด PHP ตัวอย่างต่อไปนี้เป็นตัวอย่างง่ายๆ ที่ใช้ไลบรารี Imagick เพื่อโหลดไฟล์รูปภาพและสร้างอินสแตนซ์ของคลาส OcrPHP นักพัฒนาสามารถตั้งค่าภาษาและการตั้งค่าเอนจิน OCR ก่อนทำ OCR บนรูปภาพโดยใช้เมธอด recognize() สุดท้ายจะแสดงข้อความที่สกัดได้โดยใช้เมธอด getText()

How to Extract Text from an Image using PHP Library?

require_once 'OcrPHP/autoload.php';

// Load the image file
$image = new Imagick('path/to/image.jpg');

// Create an instance of the OcrPHP class
$ocr = new OcrPHP();

// Set the language and OCR engine settings
$ocr->setLanguage('eng');
$ocr->setPageSegmentationMode(OcrPHP::PSM_SINGLE_BLOCK);

// Perform OCR on the image
$result = $ocr->recognize($image);

// Print the extracted text
echo $result->getText();

จดจำข้อความในภาษาที่ระบุด้วย PHP

ไลบรารี OcrPHP มีการสนับสนุนหลายภาษาเพื่อทำการ OCR ภายในแอปพลิเคชัน PHP ไม่ว่าข้อความของคุณจะเป็นภาษาอังกฤษ, ภาษาจีน หรือภาษาอื่นใดที่รองรับ OcrPHP สามารถจัดการได้อย่างราบรื่น เพื่อสกัดข้อความในภาษาที่ระบุ ให้ส่งรหัสภาษานั้นเป็นพารามิเตอร์และตรวจสอบให้แน่ใจว่าโมเดลภาษาของ Tesseract ที่สอดคล้องกันได้ถูกติดตั้ง ตัวอย่างต่อไปนี้แสดงให้เห็นว่าผู้พัฒนาสามารถสกัดข้อความจากรูปภาพภาษาจีนภายในแอป PHP ได้อย่างไร

How to Extract Text from an Image in Chinses Language via PHP?

require 'vendor/autoload.php';

use Fizzday\Ocr\Ocr;

$imagePath = __DIR__ . '/example-image-chinese.png';

$ocr = new Ocr();

// Extract text in Chinese
$text = $ocr->scan($imagePath, 'chi_sim'); // Use 'eng' for English

echo "Extracted Text (Chinese): \n" . $text;

การประมวลผลแบบกลุ่มและการทำงานอัตโนมัติของ OCR ด้วย PHP

สำหรับนักพัฒนาซอฟต์แวร์ที่สร้างแอปพลิเคชันการประมวลผลเอกสาร การประมวลผลแบบกลุ่มเป็นฟีเจอร์ที่มีคุณค่า ไลบรารี OcrPHP แบบโอเพ่นซอร์สทำให้ผู้พัฒนาสามารถวนลูปผ่านไดเรกทอรีของไฟล์รูปภาพและสกัดข้อความจากแต่ละไฟล์โดยอัตโนมัติ ซึ่งเหมาะอย่างยิ่งสำหรับการทำงานอัตโนมัติ เช่น การสแกนใบแจ้งหนี้, ใบเสร็จรับเงิน หรือหนังสือ ตัวอย่างต่อไปนี้เป็นตัวอย่างที่มีประโยชน์ที่สแกนไฟล์ .png ทั้งหมดในไดเรกทอรีที่ระบุ สกัดข้อความจากแต่ละไฟล์และแสดงผล คุณสามารถขยายให้บันทึกผลลัพธ์ลงไฟล์หรือฐานข้อมูล ทำให้เป็นเครื่องมือที่ทรงพลังสำหรับการประมวลผลเอกสาร

How to Extract Text from Multiple Images via PHP Library?

require 'vendor/autoload.php';

use Fizzday\Ocr\Ocr;

$directory = __DIR__ . '/images/';
$ocr = new Ocr();

foreach (glob($directory . '*.png') as $imagePath) {
    $text = $ocr->scan($imagePath);
    echo "Text from {$imagePath}: \n" . $text . "\n\n";
}

การกำหนดค่าที่กำหนดเองและการสนับสนุนการบูรณาการ

ไลบรารี OcrPHP แบบโอเพ่นซอร์สเป็นไลบรารีที่หลากหลายและเป็นมิตรต่อผู้พัฒนา ทำให้การบูรณาการความสามารถ OCR เข้าไปในโปรเจกต์ PHP ง่ายขึ้น ไลบรารีนี้อนุญาตให้คุณกำหนดค่าการตั้งค่า Tesseract ที่กำหนดเอง เช่น ภาษา, โหมดการแบ่งหน้า, และพารามิเตอร์การเตรียมภาพ เพื่อให้คุณปรับแต่งผลลัพธ์ OCR ได้ตามต้องการ

 ไทย