Aspose.OCR for Java
Top Java OCR API pentru a adăuga operații de recunoaștere optică a caracterelor
Un API-uri Java de top vă permite să construiți aplicații cu capabilități de recunoaștere optică a caracterelor (OCR). Citiți, recunoașteți textul din documentele scanate, imagini și alte fișiere prin biblioteca Java.
Aspose.OCR pentru Java este un motor OCR (Optical Character Recognition) de vârf care oferă dezvoltatorilor de software capacitatea de a integra funcționalitatea de recunoaștere a textului în aplicațiile lor Java. Este conceput pentru a fi foarte simplu de manevrat și permite dezvoltatorilor de software să recunoască textul din documente scanate, imagini și alte surse și poate fi folosit pentru a extrage text din diferite formate de fișiere, inclusiv JPEG, PNG, BMP, TIFF, HTML, PDF și multe altele.
Aspose.OCR pentru Java folosește algoritmi OCR avansați pentru a recunoaște cu acuratețe textul din imagini, chiar și în scanări sau fotografii de calitate scăzută. Acesta a inclus suport pentru peste 50 de limbi diferite, inclusiv engleză, spaniolă, franceză, germană, chineză și multe altele. Există mai multe caracteristici importante ale bibliotecii, cum ar fi recunoașterea textului scris de mână, extragerea textului din capturi de ecran, extragerea textului din anumite zone ale unei imagini, crearea de PDF-uri care pot fi căutate, suport pentru fotografiile de pe smartphone, suport pentru eliminarea zgomotului, suport pentru binarizarea imaginilor, accesibilitate sporită și multe Mai mult.
Aspose.OCR pentru Java utilizează algoritmi OCR avansați care pot recunoaște cu acuratețe textul din imagini, chiar și în scanări sau fotografii de calitate scăzută. Biblioteca poate îmbunătăți accesibilitatea pentru utilizatori prin conversia documentelor scanate în documente digitale care pot fi căutate cu ușurință. Cu algoritmii săi OCR avansati, suportul în mai multe limbi și integrarea ușoară, Aspose.OCR pentru Java devine rapid software-ul OCR de preferat pentru dezvoltatorii care doresc să adauge funcționalitate OCR la aplicațiile lor Java.
Noțiuni introductive cu Aspose.OCR pentru Java
Modul recomandat de a instala Aspose.OCR pentru Java este utilizarea Maven Repository. Vă rugăm să utilizați următoarea comandă pentru o instalare fără probleme.
Instalați Aspose.OCR pentru Java prin Maven Repository
<repositories>
<repository>
<Id>AsposeJavaAPI</Id>
<name>Aspose Java API;/name>
<url>http://repository.aspose.com/repo/</url>
</repository>
</repositories>
Puteți descărca biblioteca direct de pe Aspose.OCR pagina de produs
Extrageți text din imagini prin API-ul Python
Aspose.OCR pentru Java a inclus funcții foarte utile care le permit dezvoltatorilor de software să extragă text din diferite tipuri de imagini din aplicațiile Python. Biblioteca a inclus suport pentru citirea textului din imagini raster, cum ar fi JPEG, PNG, WBMP, BMP, GIF și multe altele. Există și alte funcții utile din bibliotecă pentru gestionarea extragerii textului, cum ar fi citirea textului din imagini TIFF cu mai multe pagini, extragerea textului din matrice de pixeli, citirea imaginilor în modul de recunoaștere cel mai rapid, recunoașterea unei singure linii, extragerea textului din chitanțe și multe altele. Următorul exemplu arată cum să extrageți text dintr-o imagine folosind comenzi Java.
Cum să extrageți text din imagine folosind API-ul Java?
AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();
Citiți zone specifice ale unei imagini prin API-ul Java
Aspose.OCR pentru Java este o bibliotecă OCR utilă care permite dezvoltatorilor de software să găsească și să citească numai anumite zone ale unei imagini, nu tot textul folosind câteva rânduri de cod Java. Este o caracteristică foarte utilă și poate fi foarte utilă în procesarea în lot pentru documente uniforme, cum ar fi vize, permise de conducere, cărți de identitate și așa mai departe. Acceptă funcții precum extragerea textului în interiorul unui dreptunghi de imagine, extragerea liniilor cu coordonate, căutarea automată a casetelor de delimitare a cuvintelor și a liniilor și multe altele. Următorul exemplu arată cum să extrageți text în interiorul unui dreptunghi folosind cod Java.
Cum să extrageți textul dintr-un dreptunghi prin intermediul API-ului Java?
AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));
Selectați zone specifice documentului prin API-ul Java
O imagine de document poate conține numeroase blocuri cu conținut variat, cum ar fi paragrafe de text, desene, diagrame, formule, tabele, hărți și așa mai departe. Aspose.OCR pentru Java permite dezvoltatorilor de software să selecteze și să detecteze anumite zone de interes pe o pagină cu ușurință și să efectueze operațiuni OCR pe aceasta. Biblioteca acceptă detectarea automată a zonei, precum și o puteți suprascrie selectând manual zonele de interes. Următorul exemplu a demonstrat modul în care dezvoltatorii de software pot activa detectarea automată a zonelor de documente în aplicațiile lor Java.
Detecția automată a zonelor de documente prin API-ul Java
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");