Aspose.OCR for Java
頂級 Java OCR API 新增光學字元辨識操作
領先的 Java API 允許建立具有光學字元辨識 (OCR) 功能的應用程式。透過 Java 程式庫讀取、識別掃描文件、圖像和其他文件中的文字。
Aspose.OCR for Java 是領先的 OCR(光學字元辨識)引擎,使軟體開發人員能夠將文字辨識功能整合到他們的 Java 應用程式中。它的設計非常易於操作,允許軟體開發人員識別掃描文件、圖像和其他來源中的文本,並可用於從各種文件格式中提取文本,包括 JPEG、PNG、BMP、TIFF、HTML、PDF和許多其他人。
Aspose.OCR for Java 使用先進的 OCR 演算法來準確識別影像中的文本,即使是低品質的掃描或照片。它支援 50 多種不同的語言,包括英語、西班牙語、法語、德語、中文等。該庫有幾個重要的功能,例如手寫文字識別、從螢幕截圖中提取文字、從圖像的特定區域提取文字、創建可搜尋的PDF、智慧型手機照片支援、雜訊消除支援、圖像二值化支援、增強的可訪問性等等更多的。
Aspose.OCR for Java 使用先進的 OCR 演算法,即使是低品質的掃描或照片,也可以準確地識別影像中的文字。該圖書館可以透過輕鬆地將掃描文件轉換為可搜尋的數位文件來增強使用者的可訪問性。憑藉其先進的 OCR 演算法、多語言支援和輕鬆集成,Aspose.OCR for Java 正迅速成為希望向其 Java 應用程式添加 OCR 功能的開發人員的首選 OCR 軟體。
Aspose.OCR for Java 入門
安裝 Aspose.OCR for Java 的建議方法是使用 Maven 儲存庫。為了順利安裝,請使用以下命令。
透過 Maven 儲存庫安裝 Aspose.OCR for Java
<repositories>
<repository>
<Id>AsposeJavaAPI</Id>
<name>Aspose Java API;/name>
<url>http://repository.aspose.com/repo/</url>
</repository>
</repositories>
您可以直接從Aspose.OCR產品頁面
下載該庫透過 Python API 從映像中提取文字
Aspose.OCR for Java 包含非常有用的功能,讓軟體開發人員可以從 Python 應用程式內的各種類型的圖像中提取文字。該庫支援從光柵圖像(例如 JPEG、PNG、WBMP、BMP、GIF 等)讀取文字。該庫還有其他有用的功能用於處理文本提取,例如從多頁TIFF 圖像中讀取文本、從像素陣列中提取文本、以最快的識別模式讀取圖像、識別單行、從收據中提取文本等等。以下範例示範如何使用 Java 命令從圖像中提取文字。
如何使用Java API從圖像中提取文字?AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();
AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();
透過 Java API 讀取影像的特定區域
Aspose.OCR for Java 是一個有用的 OCR 函式庫,允許軟體開發人員使用幾行 Java 程式碼來尋找和讀取影像的特定區域,而不是所有文字。這是一個非常有用的功能,對於大量處理簽證、駕駛執照、身分證等統一文件非常有幫助。它支援提取圖像矩形內的文字、提取帶有座標的線條、自動搜尋單字和線條邊界框等功能。以下範例示範如何使用 Java 程式碼擷取矩形內的文字。如何透過Java API提取矩形內的文字?AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));
AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));
透過 Java API 選擇文件特定區域
文件圖像可能包含許多不同內容的區塊,例如文字段落、圖畫、圖表、公式、表格、地圖等。 Aspose.OCR for Java 可讓軟體開發人員輕鬆選擇和偵測頁面上感興趣的特定區域,並對其執行 OCR 操作。 該庫支援自動區域檢測,您也可以透過手動選擇感興趣的區域來覆蓋它。以下範例示範了軟體開發人員如何在其 Java 應用程式中啟用自動文件區域檢測。
透過 Java API 自動偵測文件區域
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");