Aspose.OCR for Java
Populārākā Java OCR API, lai pievienotu optiskās rakstzīmju atpazīšanas darbības
Vadošā Java API ļauj izveidot lietojumprogrammu ar optiskās rakstzīmju atpazīšanas (OCR) iespējām. Lasiet, atpazīstiet tekstu no skenētajiem dokumentiem, attēliem un citiem failiem, izmantojot Java bibliotēku.
Aspose.OCR for Java ir vadošais OCR (Optical Character Recognition) dzinējs, kas programmatūras izstrādātājiem sniedz iespēju integrēt teksta atpazīšanas funkcionalitāti savās Java lietojumprogrammās. Tas ir izstrādāts tā, lai būtu ļoti vienkārši lietojams un ļauj programmatūras izstrādātājiem atpazīt tekstu no skenētiem dokumentiem, attēliem un citiem avotiem, un to var izmantot, lai izvilktu tekstu no dažādiem failu formātiem, tostarp JPEG, PNG, BMP, TIFF, HTML, PDF. un daudzi citi.
Aspose.OCR for Java izmanto uzlabotus OCR algoritmus, lai precīzi atpazītu tekstu no attēliem pat zemas kvalitātes skenējumos vai fotogrāfijās. Tas ir iekļāvis atbalstu vairāk nekā 50 dažādām valodām, tostarp angļu, spāņu, franču, vācu, ķīniešu un citām. Bibliotēkas daļai ir vairākas svarīgas funkcijas, piemēram, ar roku rakstīta teksta atpazīšana, teksta izvilkšana no ekrānuzņēmumiem, teksta izvilkšana no noteiktiem attēla apgabaliem, meklēšanas PDF failu izveide, viedtālruņa fotoattēlu atbalsts, trokšņu noņemšanas atbalsts, attēlu binarizācijas atbalsts, palielināta pieejamība un daudzas citas. vairāk.
Aspose.OCR for Java izmanto uzlabotus OCR algoritmus, kas var precīzi atpazīt tekstu no attēliem pat zemas kvalitātes skenētajos vai fotoattēlos. Bibliotēka var uzlabot pieejamību lietotājiem, viegli pārvēršot skenētos dokumentus par meklējamiem digitālajiem dokumentiem. Pateicoties uzlabotajiem OCR algoritmiem, vairāku valodu atbalstu un vieglu integrāciju, Aspose.OCR for Java ātri kļūst par OCR programmatūru izstrādātājiem, kuri vēlas pievienot OCR funkcionalitāti savām Java lietojumprogrammām.
Darba sākšana ar Aspose.OCR darbam ar Java
Ieteicamais veids, kā instalēt Aspose.OCR for Java, ir izmantot Maven Repository. Lūdzu, izmantojiet šo komandu vienmērīgai instalēšanai.
Instalējiet Aspose.OCR for Java, izmantojot Maven Repository
<repositories>
<repository>
<Id>AsposeJavaAPI</Id>
<name>Aspose Java API;/name>
<url>http://repository.aspose.com/repo/</url>
</repository>
</repositories>
Bibliotēku varat lejupielādēt tieši no Aspose.OCR produkta lapas
Izņemiet tekstu no attēliem, izmantojot Python API
Aspose.OCR for Java ir iekļāvis ļoti noderīgas funkcijas, kas ļauj programmatūras izstrādātājiem izvilkt tekstu no dažāda veida attēliem Python lietojumprogrammās. Bibliotēkā ir iekļauts atbalsts teksta lasīšanai no rastra attēliem, piemēram, JPEG, PNG, WBMP, BMP, GIF un daudziem citiem. Bibliotēkas daļai ir arī citas noderīgas funkcijas, kas paredzētas teksta iegūšanai, piemēram, teksta lasīšana no vairāku lappušu TIFF attēliem, teksta izvilkšana no pikseļu masīva, attēlu lasīšana ātrākajā atpazīšanas režīmā, vienas rindiņas atpazīšana, teksta izvilkšana no kvītis un daudz kas cits. Nākamajā piemērā parādīts, kā izvilkt tekstu no attēla, izmantojot Java komandas.
Kā izvilkt tekstu no attēla, izmantojot Java API?
AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();
Izlasiet konkrētus attēla apgabalus, izmantojot Java API
Aspose.OCR for Java ir noderīga OCR bibliotēka, kas programmatūras izstrādātājiem ļauj atrast un lasīt tikai noteiktus attēla apgabalus, nevis visu tekstu, izmantojot pāris Java koda rindiņas. Tā ir ļoti noderīga funkcija un var būt ļoti noderīga vienotu dokumentu, piemēram, vīzu, autovadītāja apliecību, ID karšu un tā tālāk, pakešu apstrādē. Tā atbalsta tādas funkcijas kā teksta izvilkšana attēla taisnstūrī, līniju izvilkšana ar koordinātām, automātiska vārdu un līniju ierobežojošo lodziņu meklēšana un daudzas citas. Nākamajā piemērā parādīts, kā izvilkt tekstu taisnstūrī, izmantojot Java kodu.
Kā izvilkt tekstu taisnstūrī, izmantojot Java API?
AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));
Atlasiet dokumentam specifiskus apgabalus, izmantojot Java API
Dokumenta attēlā var būt daudz dažāda satura bloku, piemēram, teksta rindkopas, zīmējumi, diagrammas, formulas, tabulas, kartes un tā tālāk. Aspose.OCR for Java ļauj programmatūras izstrādātājiem viegli atlasīt un noteikt konkrētas lapas interesējošās jomas un veikt tajā OCR darbību. Bibliotēka atbalsta automātisku apgabalu noteikšanu, kā arī varat to ignorēt, manuāli atlasot interesējošos apgabalus. Šis piemērs parāda, kā programmatūras izstrādātāji var iespējot automātisku dokumentu apgabalu noteikšanu savās Java lietojumprogrammās.
Automātiska dokumentu apgabalu noteikšana, izmantojot Java API
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");