Aspose.OCR for Java
Top Java OCR API om optische tekenherkenningsbewerkingen toe te voegen
Toonaangevende Java-API's maken het mogelijk om applicaties te bouwen met Optical Character Recognition (OCR)-mogelijkheden. Lees en herken tekst uit gescande documenten, afbeeldingen en andere bestanden via de Java-bibliotheek.
Aspose.OCR voor Java is een toonaangevende OCR-engine (Optical Character Recognition) die softwareontwikkelaars de mogelijkheid biedt om tekstherkenningsfunctionaliteit in hun Java-applicaties te integreren. Het is ontworpen om zeer eenvoudig te gebruiken en stelt softwareontwikkelaars in staat tekst te herkennen uit gescande documenten, afbeeldingen en andere bronnen, en kan worden gebruikt om tekst te extraheren uit verschillende bestandsformaten, waaronder JPEG, PNG, BMP, TIFF, HTML, PDF en vele anderen.
Aspose.OCR voor Java maakt gebruik van geavanceerde OCR-algoritmen om tekst uit afbeeldingen nauwkeurig te herkennen, zelfs in scans of foto's van lage kwaliteit. Het biedt ondersteuning voor meer dan 50 verschillende talen, waaronder Engels, Spaans, Frans, Duits, Chinees en meer. Er zijn verschillende belangrijke functies in de bibliotheek, zoals handgeschreven tekstherkenning, tekst extraheren uit schermafbeeldingen, tekst extraheren uit specifieke delen van een afbeelding, doorzoekbare PDF's maken, ondersteuning voor smartphonefoto's, ondersteuning voor het verwijderen van ruis, ondersteuning voor binarisatie van afbeeldingen, verhoogde toegankelijkheid en nog veel meer. meer.
Aspose.OCR voor Java maakt gebruik van geavanceerde OCR-algoritmen die tekst uit afbeeldingen nauwkeurig kunnen herkennen, zelfs in scans of foto's van lage kwaliteit. De bibliotheek kan de toegankelijkheid voor gebruikers verbeteren door gescande documenten eenvoudig om te zetten in doorzoekbare digitale documenten. Met zijn geavanceerde OCR-algoritmen, ondersteuning voor meerdere talen en eenvoudige integratie wordt Aspose.OCR voor Java snel de favoriete OCR-software voor ontwikkelaars die OCR-functionaliteit aan hun Java-applicaties willen toevoegen.
Aan de slag met Aspose.OCR voor Java
De aanbevolen manier om Aspose.OCR voor Java te installeren is met behulp van Maven Repository. Gebruik het volgende commando voor een vlotte installatie.
Installeer Aspose.OCR voor Java via Maven Repository
<repositories>
<repository>
<Id>AsposeJavaAPI</Id>
<name>Aspose Java API;/name>
<url>http://repository.aspose.com/repo/</url>
</repository>
</repositories>
U kunt de bibliotheek rechtstreeks downloaden vanaf de Aspose.OCR productpagina
Tekst uit afbeeldingen extraheren via Python API
Aspose.OCR voor Java bevat zeer nuttige functies waarmee softwareontwikkelaars tekst kunnen extraheren uit verschillende soorten afbeeldingen in Python-applicaties. De bibliotheek biedt ondersteuning voor het lezen van tekst uit rasterafbeeldingen zoals JPEG, PNG, WBMP, BMP, GIF en nog veel meer. Er zijn nog andere handige functies in de bibliotheek voor het verwerken van tekstextractie, zoals het lezen van tekst uit TIFF-afbeeldingen met meerdere pagina's, het extraheren van tekst uit een pixelarray, het lezen van afbeeldingen in de snelste herkenningsmodus, het herkennen van enkele regels, het extraheren van tekst uit bonnen en nog veel meer. In het volgende voorbeeld ziet u hoe u tekst uit een afbeelding kunt extraheren met behulp van Java-opdrachten.
Hoe kan ik tekst uit een afbeelding extraheren met de Java API?
AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();
Specifieke gebieden van een afbeelding lezen via Java API
Aspose.OCR voor Java is een nuttige OCR-bibliotheek waarmee softwareontwikkelaars alleen bepaalde delen van een afbeelding kunnen vinden en lezen, en niet alle tekst, met behulp van een paar regels Java-code. Het is een zeer nuttige functie en kan zeer nuttig zijn bij batchverwerking van uniforme documenten zoals visa, rijbewijzen, identiteitskaarten, enzovoort. Het ondersteunt functies zoals het extraheren van tekst binnen een beeldrechthoek, het extraheren van lijnen met coördinaten, automatisch zoeken naar woord- en lijngrenzen, en nog veel meer. In het volgende voorbeeld ziet u hoe u tekst uit een rechthoek kunt extraheren met behulp van Java-code.
Hoe tekst uit een rechthoek extraheren via de Java API?
AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));
Selecteer documentspecifieke gebieden via Java API
Een documentafbeelding kan talloze blokken met verschillende inhoud bevatten, zoals tekstparagrafen, tekeningen, diagrammen, formules, tabellen, kaarten enzovoort. Met Aspose.OCR voor Java kunnen softwareontwikkelaars eenvoudig bepaalde interessegebieden op een pagina selecteren en detecteren en er OCR-bewerkingen op uitvoeren. De bibliotheek ondersteunt automatische gebiedsdetectie en u kunt deze negeren door handmatig interessante gebieden te selecteren. Het volgende voorbeeld laat zien hoe softwareontwikkelaars automatische detectie van documentgebieden in hun Java-applicaties kunnen inschakelen.
Automatische detectie van documentgebieden via Java API
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");