Aspose.OCR for Java

Top Java OCR API zum Hinzufügen optischer Zeichenerkennungsoperationen

Eine führende Java-API ermöglicht die Erstellung von Anwendungen mit OCR-Funktionen (Optical Character Recognition). Lesen und erkennen Sie Text aus gescannten Dokumenten, Bildern und anderen Dateien über die Java-Bibliothek.

Aspose.OCR für Java ist eine führende OCR-Engine (Optical Character Recognition), die Softwareentwicklern die Möglichkeit gibt, Texterkennungsfunktionen in ihre Java-Anwendungen zu integrieren. Es ist sehr einfach zu bedienen und ermöglicht Softwareentwicklern die Erkennung von Text aus gescannten Dokumenten, Bildern und anderen Quellen. Außerdem kann es zum Extrahieren von Text aus verschiedenen Dateiformaten verwendet werden, darunter JPEG, PNG, BMP, TIFF, HTML und PDF und viele andere.

Aspose.OCR für Java verwendet fortschrittliche OCR-Algorithmen, um Text aus Bildern genau zu erkennen, selbst in Scans oder Fotos von geringer Qualität. Es unterstützt über 50 verschiedene Sprachen, darunter Englisch, Spanisch, Französisch, Deutsch, Chinesisch und mehr. Die Bibliothek umfasst mehrere wichtige Funktionen, wie z. B. handschriftliche Texterkennung, Extrahieren von Text aus Screenshots, Extrahieren von Text aus bestimmten Bereichen eines Bildes, Erstellen durchsuchbarer PDFs, Unterstützung für Smartphone-Fotos, Unterstützung für die Rauschunterdrückung, Unterstützung für die Binarisierung von Bildern, verbesserte Barrierefreiheit und vieles mehr mehr.

Aspose.OCR für Java verwendet fortschrittliche OCR-Algorithmen, die Text aus Bildern genau erkennen können, selbst in Scans oder Fotos von geringer Qualität. Die Bibliothek kann die Zugänglichkeit für Benutzer verbessern, indem sie gescannte Dokumente problemlos in durchsuchbare digitale Dokumente umwandelt. Mit seinen fortschrittlichen OCR-Algorithmen, der Unterstützung mehrerer Sprachen und der einfachen Integration entwickelt sich Aspose.OCR für Java schnell zur bevorzugten OCR-Software für Entwickler, die ihren Java-Anwendungen OCR-Funktionalität hinzufügen möchten.

Auf einen Blick

Eine Übersicht über die Funktionen von Aspose.OCR für Java.

Funktionsübersicht

OCR-Operationen
OCR-Funktionen hinzufügen
Bildtext erkennen
Convet-Textbilder
Erkannter Schriftarttext
PDF durchsuchen
27 Erkennungssprachen
OCR-Apps erstellen
Im Browser speichern
Text extrahieren
Multithreading-Unterstützung

Funktionsübersicht

Gedrehtes Bild erkennen
Vorverarbeitungsfilter
PDF in Bilder
Erkennt chinesische Zeichen
Erkennt beliebte Schriftarten
Verarbeitet das gesamte Bild
Unterstützung für gedrehte Bilder
Chargenerkennung
Integrierte Rechtschreibprüfung
PDF teilen
PDF nach Excel
PDF in SVG

Aspose.OCR for Java

API unterstützt hauptsächlich das PDF-Format, kann jedoch PDF-Dokumente in eine Reihe anderer Formate exportieren.

Leser

PDF, PDF/A, TEX, XPS, SVG

Schriftsteller

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR for Java

Plattformunabhängigkeit

Aspose.OCR für Java kann mit jeder Java-basierten Programmiersprache arbeiten.

Java-Laufzeit

Aspose.OCR for Java

Erste Schritte mit Aspose.OCR für Java

Die empfohlene Methode zur Installation von Aspose.OCR für Java ist die Verwendung des Maven Repository. Für eine reibungslose Installation verwenden Sie bitte den folgenden Befehl.

Installieren Sie Aspose.OCR für Java über das Maven-Repository

 <repositories>
	<repository>
	<Id>AsposeJavaAPI</Id>
	<name>Aspose Java API;/name>
	<url>http://repository.aspose.com/repo/</url>
    </repository>
</repositories>

Sie können die Bibliothek direkt von der Aspose.OCR-Produktseite

herunterladen

Text aus Bildern über die Python-API extrahieren

Aspose.OCR für Java verfügt über sehr nützliche Funktionen, die es Softwareentwicklern ermöglichen, Text aus verschiedenen Bildtypen in Python-Anwendungen zu extrahieren. Die Bibliothek unterstützt das Lesen von Text aus Rasterbildern wie JPEG, PNG, WBMP, BMP, GIF und vielen mehr. Die Bibliothek verfügt über weitere nützliche Funktionen zur Textextraktion, z. B. das Lesen von Text aus mehrseitigen TIFF-Bildern, das Extrahieren von Text aus einem Pixelarray, das Lesen von Bildern im schnellsten Erkennungsmodus, das Erkennen einzelner Zeilen, das Extrahieren von Text aus Belegen und vieles mehr. Das folgende Beispiel zeigt, wie Sie mithilfe von Java-Befehlen Text aus einem Bild extrahieren.

Wie extrahiere ich Text aus einem Bild mithilfe der Java-API?

AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
	System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();

Bestimmte Bereiche eines Bildes über die Java-API lesen

Aspose.OCR für Java ist eine nützliche OCR-Bibliothek, die es Softwareentwicklern ermöglicht, mithilfe einiger Zeilen Java-Code nur bestimmte Bereiche eines Bildes und nicht den gesamten Text zu finden und zu lesen. Dies ist eine sehr nützliche Funktion und kann bei der Stapelverarbeitung für einheitliche Dokumente wie Visa, Führerscheine, Personalausweise usw. sehr hilfreich sein. Es unterstützt Funktionen wie das Extrahieren von Text innerhalb eines Bildrechtecks, das Extrahieren von Linien mit Koordinaten, die automatische Suche nach Wort- und Zeilenbegrenzungsrahmen und vieles mehr. Das folgende Beispiel zeigt, wie Sie mithilfe von Java-Code Text innerhalb eines Rechtecks extrahieren.

Wie extrahiere ich Text innerhalb eines Rechtecks über die Java-API?

AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);	
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));

Dokumentspezifische Bereiche über Java API auswählen

Ein Dokumentbild kann zahlreiche Blöcke mit unterschiedlichem Inhalt enthalten, z. B. Textabsätze, Zeichnungen, Diagramme, Formeln, Tabellen, Karten usw. Aspose.OCR für Java ermöglicht Softwareentwicklern die einfache Auswahl und Erkennung bestimmter Interessenbereiche auf einer Seite und die Durchführung von OCR-Vorgängen darauf. Die Bibliothek unterstützt die automatische Bereichserkennung und Sie können diese durch manuelle Auswahl relevanter Bereiche außer Kraft setzen. Das folgende Beispiel zeigt, wie Softwareentwickler die automatische Erkennung von Dokumentbereichen in ihren Java-Anwendungen aktivieren können.

Automatische Dokumentbereichserkennung über Java API

 // Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");