1. Produkter
  2.   OCR
  3.   Java
  4.   Aspose.OCR for Java

Aspose.OCR for Java

 
 

Topp Java OCR API för att lägga till operationer för optisk teckenigenkänning

En ledande Java API gör det möjligt att bygga applikationer med funktioner för optisk teckenigenkänning (OCR). Läs, känna igen text från skannade dokument, bilder och andra filer via Java Library.

Aspose.OCR för Java är en ledande OCR-motor (Optical Character Recognition) som ger mjukvaruutvecklare möjligheten att integrera textigenkänningsfunktioner i sina Java-applikationer. Den är designad för att vara mycket enkel att hantera och låter mjukvaruutvecklare känna igen text från skannade dokument, bilder och andra källor, och kan användas för att extrahera text från olika filformat, inklusive JPEG, PNG, BMP, TIFF, HTML, PDF och många andra.

Aspose.OCR för Java använder avancerade OCR-algoritmer för att korrekt känna igen text från bilder, även vid skanningar eller fotografier av låg kvalitet. Det har inkluderat stöd för över 50 olika språk, inklusive engelska, spanska, franska, tyska, kinesiska och mer. Det finns flera viktiga funktioner i biblioteket som handskriven textigenkänning, extrahera text från skärmdumpar, extrahera text från specifika delar av en bild, skapa sökbara PDF-filer, stöd för smartphone-bilder, stöd för brusborttagning, stöd för bildbinarisering, ökad tillgänglighet och många Mer.

Aspose.OCR för Java använder avancerade OCR-algoritmer som exakt kan känna igen text från bilder, även vid skanningar eller fotografier av låg kvalitet. Biblioteket kan förbättra tillgängligheten för användare genom att enkelt konvertera skannade dokument till sökbara digitala dokument. Med sina avancerade OCR-algoritmer, stöd för flera språk och enkla integration, blir Aspose.OCR för Java snabbt OCR-programvaran för utvecklare som vill lägga till OCR-funktioner till sina Java-applikationer.

Previous Next

Komma igång med Aspose.OCR för Java

Det rekommenderade sättet att installera Aspose.OCR för Java är att använda Maven Repository. Använd följande kommando för en smidig installation.

Installera Aspose.OCR för Java via Maven Repository

 <repositories>
	<repository>
	<Id>AsposeJavaAPI</Id>
	<name>Aspose Java API;/name>
	<url>http://repository.aspose.com/repo/</url>
    </repository>
</repositories>

Du kan ladda ner biblioteket direkt från Aspose.OCR produktsida

Extrahera text från bilder via Python API

Aspose.OCR för Java har inkluderat mycket användbara funktioner som tillåter mjukvaruutvecklare att extrahera text från olika typer av bilder i Python-applikationer. Biblioteket har inkluderat stöd för att läsa text från rasterbilder som JPEG, PNG, WBMP, BMP, GIF och många fler. Det finns andra användbara funktioner i biblioteket för att hantera textextraktion som att läsa text från flersidiga TIFF-bilder, extrahera text från pixel array, läsa bilder i snabbaste igenkänningsläge, känna igen en rad, extrahera text från kvitton och många fler. Följande exempel visar hur man extraherar text från en bild med Java-kommandon.

Hur extraherar man text från bild med Java API?

AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
	System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();

Läs specifika områden i en bild via Java API

Aspose.OCR för Java är ett användbart OCR-bibliotek som tillåter mjukvaruutvecklare att hitta och läsa endast vissa delar av en bild, inte all text med ett par rader Java-kod. Det är en mycket användbar funktion och kan vara till stor hjälp vid batchbearbetning av enhetliga dokument som visum, körkort, ID-kort och så vidare. Den stöder funktioner som att extrahera text inuti en bildrektangel, extrahera linjer med koordinater, automatisk sökning efter ord- och radavgränsningsrutor och många fler. Följande exempel visar hur man extraherar text inuti en rektangel med Java-kod.

Hur extraherar man text inuti en rektangel via Java API?

AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);	
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));

Välj dokumentspecifika områden via Java API

En dokumentbild kan innehålla många block med olika innehåll såsom textstycken, ritningar, diagram, formler, tabeller, kartor och så vidare. Aspose.OCR för Java gör det möjligt för mjukvaruutvecklare att enkelt välja och upptäcka särskilda intresseområden på en sida och utföra OCR-operationer på den. Biblioteket stöder automatisk områdesdetektering och du kan åsidosätta det genom att manuellt välja intresseområden. Följande exempel visade hur mjukvaruutvecklare kan aktivera automatisk identifiering av dokumentområden i sina Java-applikationer.

Automatisk identifiering av dokumentområden via Java API

 // Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");

 Svenska