Aspose.OCR for Java
Top Java OCR API til tilføjelse af optiske tegngenkendelsesoperationer
En førende Java API'er gør det muligt at bygge applikationer med Optical Character Recognition (OCR)-funktioner. Læs, genkend tekst fra scannede dokumenter, billeder og andre filer via Java Library.
Aspose.OCR til Java er en førende OCR-motor (Optical Character Recognition), der giver softwareudviklere mulighed for at integrere tekstgenkendelsesfunktionalitet i deres Java-applikationer. Den er designet til at være meget enkel at håndtere og giver softwareudviklere mulighed for at genkende tekst fra scannede dokumenter, billeder og andre kilder og kan bruges til at udtrække tekst fra forskellige filformater, herunder JPEG, PNG, BMP, TIFF, HTML, PDF og mange andre.
Aspose.OCR til Java bruger avancerede OCR-algoritmer til nøjagtigt at genkende tekst fra billeder, selv i lavkvalitetsscanninger eller fotografier. Det har inkluderet understøttelse af over 50 forskellige sprog, herunder engelsk, spansk, fransk, tysk, kinesisk og mere. Der er flere vigtige funktioner i biblioteket, såsom håndskrevet tekstgenkendelse, udtræk tekst fra skærmbilleder, udtræk tekst fra specifikke områder af et billede, oprette søgbare PDF-filer, understøttelse af smartphone-fotos, understøttelse af fjernelse af støj, understøttelse af billedbinarisering, øget tilgængelighed og mange mere.
Aspose.OCR til Java bruger avancerede OCR-algoritmer, der nøjagtigt kan genkende tekst fra billeder, selv i lavkvalitetsscanninger eller fotografier. Biblioteket kan forbedre tilgængeligheden for brugerne ved let at konvertere scannede dokumenter til søgbare digitale dokumenter. Med sine avancerede OCR-algoritmer, understøttelse af flere sprog og nemme integration er Aspose.OCR til Java hurtigt ved at blive den foretrukne OCR-software for udviklere, der ønsker at tilføje OCR-funktionalitet til deres Java-applikationer.
Kom godt i gang med Aspose.OCR til Java
Den anbefalede måde at installere Aspose.OCR til Java på er at bruge Maven Repository. Brug venligst følgende kommando for en problemfri installation.
Installer Aspose.OCR til Java via Maven Repository
<repositories>
<repository>
<Id>AsposeJavaAPI</Id>
<name>Aspose Java API;/name>
<url>http://repository.aspose.com/repo/</url>
</repository>
</repositories>
Du kan downloade biblioteket direkte fra Aspose.OCR-produktsiden
Udtræk tekst fra billeder via Python API
Aspose.OCR til Java har inkluderet meget nyttige funktioner, der gør det muligt for softwareudviklere at udtrække tekst fra forskellige typer billeder i Python-applikationer. Biblioteket har inkluderet understøttelse af læsning af tekst fra rasterbilleder som JPEG, PNG, WBMP, BMP, GIF og mange flere. Der er andre nyttige funktioner i biblioteket til håndtering af tekstudtræk, såsom læsning af tekst fra TIFF-billeder på flere sider, udtrækning af tekst fra pixel-array, læsning af billeder i hurtigste genkendelsestilstand, genkendelse af enkelt linje, udtrækning af tekst fra kvitteringer og mange flere. Følgende eksempel viser, hvordan man udtrækker tekst fra et billede ved hjælp af Java-kommandoer.
Hvordan udtrækkes tekst fra billede ved hjælp af Java API?
AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();
Læs specifikke områder af et billede via Java API
Aspose.OCR til Java er et nyttigt OCR-bibliotek, der tillader softwareudviklere kun at finde og læse bestemte områder af et billede, ikke al tekst ved hjælp af et par linjer Java-kode. Det er en meget nyttig funktion og kan være meget nyttig i batchbehandling af ensartede dokumenter som visa, kørekort, ID-kort og så videre. Det understøtter funktioner som at udtrække tekst inde i et billedrektangel, udtrækning af linjer med koordinater, automatisk søgning efter ord- og linjeafgrænsningsfelter og mange flere. Følgende eksempel viser, hvordan man udtrækker tekst inde i et rektangel ved hjælp af Java-kode.
Hvordan udtrækkes tekst inde i et rektangel via Java API?
AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));
Vælg dokumentspecifikke områder via Java API
Et dokumentbillede kan indeholde adskillige blokke med forskelligt indhold, såsom tekstafsnit, tegninger, diagrammer, formler, tabeller, kort og så videre. Aspose.OCR til Java gør det muligt for softwareudviklere at vælge og registrere bestemte interesseområder på en side med lethed og udføre OCR-operationer på den. Biblioteket understøtter automatisk områderegistrering, ligesom du kan tilsidesætte det ved manuelt at vælge områder af interesse. Følgende eksempel demonstrerede, hvordan softwareudviklere kan aktivere automatisk registrering af dokumentområder i deres Java-applikationer.
Automatisk registrering af dokumentområder via Java API
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");