Aspose.OCR for Java
Topp Java OCR API for å legge til operasjoner for optisk tegngjenkjenning
En ledende Java API-er gjør det mulig å bygge applikasjoner med Optical Character Recognition (OCR)-funksjoner. Les, gjenkjenne tekst fra skannede dokumenter, bilder og andre filer via Java Library.
Aspose.OCR for Java er en ledende OCR-motor (Optical Character Recognition) som gir programvareutviklere muligheten til å integrere tekstgjenkjenningsfunksjonalitet i Java-applikasjonene sine. Den er designet for å være veldig enkel å håndtere og lar programvareutviklere gjenkjenne tekst fra skannede dokumenter, bilder og andre kilder, og kan brukes til å trekke ut tekst fra ulike filformater, inkludert JPEG, PNG, BMP, TIFF, HTML, PDF og mange andre.
Aspose.OCR for Java bruker avanserte OCR-algoritmer for å gjenkjenne tekst fra bilder nøyaktig, selv i skanninger eller fotografier av lav kvalitet. Den har inkludert støtte for over 50 forskjellige språk, inkludert engelsk, spansk, fransk, tysk, kinesisk og mer. Det er flere viktige funksjoner i biblioteket, for eksempel håndskrevet tekstgjenkjenning, trekke ut tekst fra skjermbilder, trekke ut tekst fra bestemte områder av et bilde, lage søkbare PDF-filer, støtte for smarttelefonbilder, støtte for fjerning av støy, støtte for bildebinarisering, økt tilgjengelighet og mange mer.
Aspose.OCR for Java bruker avanserte OCR-algoritmer som nøyaktig kan gjenkjenne tekst fra bilder, selv i skanninger eller fotografier av lav kvalitet. Biblioteket kan forbedre tilgjengeligheten for brukere ved å enkelt konvertere skannede dokumenter til søkbare digitale dokumenter. Med sine avanserte OCR-algoritmer, støtte for flere språk og enkel integrasjon, er Aspose.OCR for Java raskt i ferd med å bli den beste OCR-programvaren for utviklere som ønsker å legge til OCR-funksjonalitet til Java-applikasjonene sine.
Kom i gang med Aspose.OCR for Java
Den anbefalte måten å installere Aspose.OCR for Java på er å bruke Maven Repository. Bruk følgende kommando for en jevn installasjon.
Installer Aspose.OCR for Java via Maven Repository
<repositories>
<repository>
<Id>AsposeJavaAPI</Id>
<name>Aspose Java API;/name>
<url>http://repository.aspose.com/repo/</url>
</repository>
</repositories>
Du kan laste ned biblioteket direkte fra Aspose.OCR produktside
trekk ut tekst fra bilder via Python API
Aspose.OCR for Java har inkludert svært nyttige funksjoner som lar programvareutviklere trekke ut tekst fra ulike typer bilder i Python-applikasjoner. Biblioteket har inkludert støtte for lesing av tekst fra rasterbilder som JPEG, PNG, WBMP, BMP, GIF og mange flere. Det er andre nyttige funksjoner i biblioteket for å håndtere tekstutvinning, for eksempel å lese tekst fra TIFF-bilder på flere sider, trekke ut tekst fra pikselmatrisen, lese bilder i raskeste gjenkjenningsmodus, gjenkjenne enkeltlinje, trekke ut tekst fra kvitteringer og mange flere. Følgende eksempel viser hvordan du trekker ut tekst fra et bilde ved hjelp av Java-kommandoer.
Hvordan trekke ut tekst fra bilde ved hjelp av Java API?
AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();
Les spesifikke områder av et bilde via Java API
Aspose.OCR for Java er et nyttig OCR-bibliotek som lar programvareutviklere finne og lese bare bestemte områder av et bilde, ikke all tekst ved å bruke et par linjer med Java-kode. Det er en veldig nyttig funksjon og kan være svært nyttig i batch-behandling for ensartede dokumenter som visum, førerkort, ID-kort og så videre. Den støtter funksjoner som å trekke ut tekst inne i et bilderektangel, trekke ut linjer med koordinater, automatisk søk etter ord- og linjeavgrensningsbokser og mange flere. Følgende eksempel viser hvordan du trekker ut tekst inne i et rektangel ved hjelp av Java-kode.
Hvordan trekke ut tekst i et rektangel via Java API?
AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));
Velg dokumentspesifikke områder via Java API
Et dokumentbilde kan inneholde flere blokker med forskjellig innhold som tekstavsnitt, tegninger, diagrammer, formler, tabeller, kart og så videre. Aspose.OCR for Java gjør det mulig for programvareutviklere å velge og oppdage spesielle områder av interesse på en side med letthet og utføre OCR-operasjoner på den. Biblioteket støtter automatisk områdedeteksjon i tillegg til at du kan overstyre det ved å velge områder av interesse manuelt. Følgende eksempel demonstrerte hvordan programvareutviklere kan aktivere automatisk registrering av dokumentområder inne i Java-applikasjonene sine.
Automatisk registrering av dokumentområder via Java API
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");