ไลบรารี Java โอเพ่นซอร์สสำหรับการประมวลผลข้อความและรูปภาพ OCR
ไลบรารี Java ฟรีชั้นนำที่ช่วยให้นักพัฒนาซอฟต์แวร์สามารถเพิ่มความสามารถ OCR ให้กับแอป Java และดำเนินการ OCR บนรูปภาพที่สแกนและไฟล์ PDF เพื่อแยกข้อความจากสิ่งเหล่านี้ได้อย่างง่ายดาย.
Asprise OCR SDK สำหรับ Java เป็น Java SDK แบบโอเพ่นซอร์สที่ทรงพลัง มอบความสามารถในการดำเนินการรู้จำอักขระด้วยแสง (OCR) บนรูปภาพที่สแกน ไฟล์ PDF และเอกสารอื่นๆ ด้วย Java API ที่ใช้งานง่าย SDK นี้สามารถช่วยนักพัฒนาเพิ่มความสามารถ OCR ให้กับแอปพลิเคชัน Java ได้อย่างรวดเร็วและง่ายดาย OCR เป็นเทคโนโลยีที่มีประโยชน์มากที่ช่วยให้คอมพิวเตอร์จดจำข้อความในภาพหรือเอกสารได้ ซอฟต์แวร์ OCR สามารถใช้ในการแปลงรูปภาพที่สแกนของข้อความให้เป็นข้อความดิจิทัลที่สามารถแก้ไข ค้นหา หรือประมวลผลด้วยคอมพิวเตอร์ได้
Aprise OCR SDK ได้รวมคุณสมบัติที่สำคัญหลายประการสำหรับการจัดการกิจกรรมที่เกี่ยวข้องกับ OCR เช่น การประมวลผล OCR ที่รวดเร็ว รองรับหลายภาษา ระบบเพิ่มประสิทธิภาพรูปภาพ ข้อความที่จดจำได้ในรูปแบบที่หลากหลาย และอื่นๆ อีกมากมาย SDK ขึ้นอยู่กับเทคโนโลยี OCR ขั้นสูงที่สามารถจดจำข้อความในแบบอักษรและภาษาที่หลากหลาย ไลบรารีนี้สามารถใช้เพื่อพัฒนาแอปพลิเคชันสำหรับแอปเพล็ต Java, เว็บแอปพลิเคชัน, ส่วนประกอบ Swing/JavaFX และแอปพลิเคชันระดับองค์กร JEE
Aprise OCR SDK ช่วยให้นักพัฒนาซอฟต์แวร์สามารถส่งออกข้อความที่รู้จักในรูปแบบที่หลากหลาย รวมถึงข้อความธรรมดา PDF ที่ค้นหาได้ และ Microsoft Word SDK สามารถจดจำข้อความได้มากกว่า 100 ภาษา รวมถึงภาษาอังกฤษ จีน ญี่ปุ่น อาหรับ และอื่นๆ อีกมากมาย ด้วยเทคโนโลยี OCR ขั้นสูง การรองรับภาษาที่ครอบคลุม และ API ที่ใช้งานง่าย SDK นี้สามารถช่วยนักพัฒนาประหยัดเวลาและความพยายามในการสร้างแอปพลิเคชัน OCR
การเริ่มต้นใช้งาน Asprise OCR SDK สำหรับ Java
การเริ่มต้นใช้งาน Asprise OCR SDK สำหรับ Java วิธีที่แนะนำในการติดตั้ง Asprise OCR SDK สำหรับ Java คือการใช้ Maven โปรดใช้คำสั่งต่อไปนี้เพื่อการติดตั้งที่ราบรื่น
การพึ่งพา Maven สำหรับ Asprise OCR SDK สำหรับ Java
<dependencies>
<dependency>
<groupId>com.asprise.ocr</groupId>
<artifactId>java-ocr-api;/artifactId>
<version>[15,)</version>
</dependency>
</dependencies>
ติดตั้ง Asprise OCR SDK สำหรับ Java ผ่าน GitHub
git clone https://github.com/Asprise/java-.net-ocr-api-library
แยกข้อความในรูปแบบข้อความธรรมดาผ่าน Java
Asprise OCR SDK สำหรับ Java มีฟังก์ชันการทำงานที่สมบูรณ์สำหรับการแยกข้อความจากรูปภาพในรูปแบบข้อความธรรมดา ไลบรารีช่วยให้ผู้ใช้ดึงเนื้อหาข้อความของเอกสารหรือรูปภาพที่สแกนได้อย่างง่ายดาย และใช้สำหรับการประมวลผลหรือการวิเคราะห์เพิ่มเติม เพื่อให้บรรลุภารกิจการแยกข้อความธรรมดา คุณต้องโหลดรูปภาพจากไฟล์ อินพุตสตรีม หรือ URL และใช้การรับรู้ OCR กับรูปภาพที่โหลดโดยใช้ API ใช้ฟังก์ชันที่เหมาะสมเพื่อดึงข้อความที่รู้จักในรูปแบบข้อความธรรมดา ข้อมูลต่อไปนี้แสดงวิธีการโหลดรูปภาพ และข้อความที่รู้จักเป็นข้อความธรรมดา และผลลัพธ์จะถูกพิมพ์ไปยังคอนโซล
โหลดรูปภาพและข้อความที่จดจำผ่าน Java API
import com.asprise.ocr.Ocr;
public class OCRTest {
public static void main(String[] args) throws Exception {
// Load image from file
Ocr ocr = new Ocr();
ocr.startEngine("eng", Ocr.SPEED_FASTEST);
String recognizedText = ocr.recognize(new File("image.png"), Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);
// Print the plain text output
System.out.println("Recognized Text: " + recognizedText);
ocr.stopEngine();
}
}
ดำเนินการ OCR ต่างๆ ใน Java Apps
Asprise OCR SDK สำหรับ Java API ช่วยให้นักพัฒนาซอฟต์แวร์ดำเนินการ OCR (Optical Character Recognition) ต่างๆ บนเอกสารประเภทต่างๆ ได้ ไลบรารีรองรับการทำงาน OCR ประเภทต่างๆ อย่างสมบูรณ์ เช่น ไฟล์ภาพ OCR, ไฟล์ OCR PDF, ข้อความที่เขียนด้วยลายมือ OCR, OCR หลายภาษา, ทำ OCR ในส่วนของภาพ, ทำ OCR กับไฟล์อินพุตหลายไฟล์ในช็อตเดียว, ทำ OCR บน หน้าบางหน้าจากไฟล์ TIFF ที่ระบุ, การประมวลผล OCR Batch และอื่น ๆ อีกมากมาย ไลบรารีมีเครื่องมือที่มีประสิทธิภาพและยืดหยุ่นสำหรับการดำเนินการ OCR กับเอกสารประเภทต่างๆ ด้วยการรองรับหลายภาษา ไฟล์รูปภาพและ PDF ข้อความที่เขียนด้วยลายมือ และการประมวลผลเป็นชุด คุณจึงสามารถแยกข้อความจากเอกสารของคุณได้อย่างรวดเร็วและแม่นยำ
ดำเนินการ OCR กับหลายไฟล์ผ่าน Java Library
String s = ocr.recognize("test.png;test2.jpg", -1, 0, 0, 400, 200,
Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);
perform OCR on a PDF input file:
String s = ocr.recognize("test.pdf", -1, 100, 100, 400, 200,
Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);
การสนับสนุนแบบมัลติเธรดโดยใช้ Asprise OCR
Asprise OCR SDK สำหรับ Java API ได้รวมการสนับสนุนที่สมบูรณ์สำหรับมัลติเธรด ซึ่งช่วยให้นักพัฒนาสามารถประมวลผลงาน OCR หลายงานพร้อมกันได้ คุณสมบัตินี้ช่วยให้นักพัฒนาสามารถปรับปรุงประสิทธิภาพของแอปพลิเคชัน OCR ของตนโดยกระจายการประมวลผล OCR ไปยังหลายเธรด ซึ่งสามารถทำงานพร้อมกันบนคอร์หรือโปรเซสเซอร์หลายตัว การสนับสนุนแบบมัลติเธรดสามารถปรับแต่งได้สูง ช่วยให้นักพัฒนาสามารถปรับแต่งจำนวนเธรดและเอ็นจิ้น OCR เพื่อให้ตรงกับทรัพยากรที่มีอยู่และข้อกำหนดในการประมวลผล โดยส่วนใหญ่แล้ว Asprise OCR SDK สำหรับการรองรับมัลติเธรดของ Java ช่วยให้นักพัฒนามีเครื่องมือที่ทรงพลังและยืดหยุ่นสำหรับการสร้างแอปพลิเคชัน OCR ประสิทธิภาพสูง ซึ่งสามารถประมวลผลข้อความจำนวนมากได้อย่างรวดเร็วและมีประสิทธิภาพ
การเขียนโค้ดการจัดการเธรดที่ซับซ้อน
OcrExecutorService oes =
new OcrExecutorService("eng", Ocr.SPEED_FASTEST, 4); // 4 threads
List> futures = oes.invokeAll(Arrays.asList(
new OcrExecutorService.OcrCallable(
new File[] {new File("test1.png")},
Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML),
new OcrExecutorService.OcrCallable(
new File[] {new File("test2.png")},
Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML)
);
System.out.println("Result of test1.png: " + futures.get(0).get());
System.out.println("Result of test2.png: " + futures.get(1).get());
oes.shutdown(); // stops all OCR engines and disposes all threads