Aspose.OCR for Java
Java OCR API อันดับต้น ๆ เพื่อเพิ่มการดำเนินการรู้จำอักขระแบบออปติคัล
Java API ชั้นนำช่วยให้สามารถสร้างแอปพลิเคชันที่มีความสามารถ Optical Character Recognition (OCR) อ่าน จดจำข้อความจากเอกสารที่สแกน รูปภาพ และไฟล์อื่นๆ ผ่านทาง Java Library
Aspose.OCR สำหรับ Java คือกลไก OCR (Optical Character Recognition) ชั้นนำที่ช่วยให้นักพัฒนาซอฟต์แวร์สามารถรวมฟังก์ชันการรู้จำข้อความเข้ากับแอปพลิเคชัน Java ของตนได้ ได้รับการออกแบบมาให้จัดการได้ง่ายมากและช่วยให้นักพัฒนาซอฟต์แวร์สามารถจดจำข้อความจากเอกสารที่สแกน รูปภาพ และแหล่งอื่นๆ ได้ และสามารถใช้เพื่อแยกข้อความจากรูปแบบไฟล์ต่างๆ รวมถึง JPEG, PNG, BMP, TIFF, HTML, PDF และอื่นๆ อีกมากมาย
Aspose.OCR สำหรับ Java ใช้อัลกอริธึม OCR ขั้นสูงเพื่อจดจำข้อความจากรูปภาพได้อย่างแม่นยำ แม้ในการสแกนหรือภาพถ่ายคุณภาพต่ำ มีการรองรับภาษาต่างๆ มากกว่า 50 ภาษา รวมถึงภาษาอังกฤษ สเปน ฝรั่งเศส เยอรมัน จีน และอื่นๆ อีกมากมาย มีคุณสมบัติที่สำคัญหลายประการในไลบรารี เช่น การรู้จำข้อความที่เขียนด้วยลายมือ แยกข้อความจากภาพหน้าจอ แยกข้อความจากพื้นที่เฉพาะของรูปภาพ สร้าง PDF ที่ค้นหาได้ รองรับภาพถ่ายบนสมาร์ทโฟน รองรับการลบจุดรบกวน รองรับภาพไบนาไรเซชัน การเข้าถึงที่เพิ่มขึ้น และอื่นๆ อีกมากมาย มากกว่า.
Aspose.OCR สำหรับ Java ใช้อัลกอริธึม OCR ขั้นสูงที่สามารถจดจำข้อความจากรูปภาพได้อย่างแม่นยำ แม้ในการสแกนหรือภาพถ่ายคุณภาพต่ำ ห้องสมุดสามารถปรับปรุงการเข้าถึงสำหรับผู้ใช้โดยการแปลงเอกสารที่สแกนเป็นเอกสารดิจิทัลที่สามารถค้นหาได้อย่างง่ายดาย ด้วยอัลกอริธึม OCR ขั้นสูง การรองรับหลายภาษา และการผสานรวมที่ง่ายดาย Aspose.OCR สำหรับ Java กำลังกลายเป็นซอฟต์แวร์ OCR ที่ได้รับความนิยมอย่างรวดเร็วสำหรับนักพัฒนาที่ต้องการเพิ่มฟังก์ชัน OCR ให้กับแอปพลิเคชัน Java ของตน
การเริ่มต้นใช้งาน Aspose.OCR สำหรับ Java
วิธีที่แนะนำในการติดตั้ง Aspose.OCR สำหรับ Java คือการใช้ Maven Repository โปรดใช้คำสั่งต่อไปนี้เพื่อการติดตั้งที่ราบรื่น
ติดตั้ง Aspose.OCR สำหรับ Java ผ่าน Maven Repository
<repositories>
<repository>
<Id>AsposeJavaAPI</Id>
<name>Aspose Java API;/name>
<url>http://repository.aspose.com/repo/</url>
</repository>
</repositories>
คุณสามารถดาวน์โหลดไลบรารีได้โดยตรงจากAspose.OCR หน้าผลิตภัณฑ์
แยกข้อความจากรูปภาพผ่าน Python API
Aspose.OCR สำหรับ Java มีคุณสมบัติที่มีประโยชน์มาก ช่วยให้นักพัฒนาซอฟต์แวร์สามารถดึงข้อความจากรูปภาพประเภทต่างๆ ภายในแอปพลิเคชัน Python ได้ ไลบรารีได้รวมการสนับสนุนสำหรับการอ่านข้อความจากภาพแรสเตอร์ เช่น JPEG, PNG, WBMP, BMP, GIF และอื่นๆ อีกมากมาย มีคุณสมบัติที่เป็นประโยชน์อื่นๆ ส่วนหนึ่งของไลบรารีสำหรับจัดการการแยกข้อความ เช่น การอ่านข้อความจากรูปภาพ TIFF หลายหน้า การแยกข้อความจากอาร์เรย์พิกเซล การอ่านรูปภาพในโหมดการจดจำที่เร็วที่สุด การจดจำบรรทัดเดียว การแยกข้อความจากใบเสร็จรับเงิน และอื่นๆ อีกมากมาย ตัวอย่างต่อไปนี้แสดงวิธีการแยกข้อความจากรูปภาพโดยใช้คำสั่ง Java
จะแยกข้อความจากรูปภาพโดยใช้ Java API ได้อย่างไร
AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();
อ่านพื้นที่เฉพาะของรูปภาพผ่าน Java API
Aspose.OCR สำหรับ Java เป็นไลบรารี OCR ที่มีประโยชน์ ช่วยให้นักพัฒนาซอฟต์แวร์สามารถค้นหาและอ่านเฉพาะพื้นที่ของรูปภาพ ไม่ใช่ข้อความทั้งหมดที่ใช้โค้ด Java สองสามบรรทัด เป็นคุณสมบัติที่มีประโยชน์มากและมีประโยชน์มากในการประมวลผลเป็นชุดสำหรับเอกสารที่เหมือนกัน เช่น วีซ่า ใบขับขี่ บัตรประจำตัวประชาชน และอื่นๆ รองรับคุณสมบัติต่างๆ เช่น การแยกข้อความภายในสี่เหลี่ยมรูปภาพ การแยกบรรทัดด้วยพิกัด การค้นหาอัตโนมัติสำหรับคำและกล่องขอบเขตบรรทัด และอื่นๆ อีกมากมาย ตัวอย่างต่อไปนี้แสดงวิธีการแยกข้อความภายในสี่เหลี่ยมโดยใช้โค้ด Java
จะแยกข้อความภายในสี่เหลี่ยมผืนผ้าผ่าน Java API ได้อย่างไร
AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));
เลือกพื้นที่เฉพาะเอกสารผ่าน Java API
รูปภาพในเอกสารอาจมีเนื้อหาหลากหลายบล็อก เช่น ย่อหน้าข้อความ ภาพวาด ไดอะแกรม สูตร ตาราง แผนที่ และอื่นๆ Aspose.OCR สำหรับ Java ช่วยให้นักพัฒนาซอฟต์แวร์สามารถเลือกและตรวจจับพื้นที่เฉพาะที่น่าสนใจบนเพจได้อย่างง่ายดาย และดำเนินการ OCR บนเพจนั้นได้ ไลบรารีรองรับการตรวจจับพื้นที่อัตโนมัติ และคุณสามารถแทนที่ได้โดยการเลือกพื้นที่ที่สนใจด้วยตนเอง ตัวอย่างต่อไปนี้แสดงให้เห็นว่านักพัฒนาซอฟต์แวร์สามารถเปิดใช้งานการตรวจหาพื้นที่เอกสารอัตโนมัติภายในแอปพลิเคชัน Java ของตนได้อย่างไร
การตรวจจับพื้นที่เอกสารอัตโนมัติผ่าน Java API
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");