Aspose.OCR for Java
Populiariausia Java OCR API, skirta pridėti optinių simbolių atpažinimo operacijas
Pirmaujanti „Java“ API leidžia kurti programą su optinio simbolių atpažinimo (OCR) galimybėmis. Skaitykite, atpažinkite tekstą iš nuskaitytų dokumentų, vaizdų ir kitų failų naudodami „Java“ biblioteką.
Aspose.OCR for Java yra pirmaujantis OCR (Optical Character Recognition) variklis, suteikiantis programinės įrangos kūrėjams galimybę integruoti teksto atpažinimo funkciją į savo Java programas. Jis sukurtas taip, kad jį būtų labai paprasta valdyti ir leidžia programinės įrangos kūrėjams atpažinti tekstą iš nuskaitytų dokumentų, vaizdų ir kitų šaltinių bei gali būti naudojamas tekstui išgauti iš įvairių failų formatų, įskaitant JPEG, PNG, BMP, TIFF, HTML, PDF. ir daugelis kitų.
Aspose.OCR for Java naudoja pažangius OCR algoritmus, kad tiksliai atpažintų tekstą iš vaizdų, net ir prastos kokybės nuskaitymuose ar nuotraukose. Ji apima daugiau nei 50 skirtingų kalbų palaikymą, įskaitant anglų, ispanų, prancūzų, vokiečių, kinų ir kt. Yra keletas svarbių bibliotekos funkcijų, tokių kaip ranka rašyto teksto atpažinimas, teksto ištraukimas iš ekrano kopijų, teksto ištraukimas iš konkrečių vaizdo sričių, ieškomų PDF failų kūrimas, išmaniųjų telefonų nuotraukų palaikymas, triukšmo pašalinimo palaikymas, vaizdo dvejetainio palaikymas, padidintas prieinamumas ir daugelis kitų. daugiau.
Aspose.OCR for Java naudoja pažangius OCR algoritmus, kurie gali tiksliai atpažinti tekstą iš vaizdų, net ir prastos kokybės nuskaitymuose ar nuotraukose. Biblioteka gali pagerinti naudotojų prieinamumą, nes lengvai konvertuoja nuskaitytus dokumentus į skaitmeninius dokumentus, kuriuose galima ieškoti. Su pažangiais OCR algoritmais, kelių kalbų palaikymu ir lengvu integravimu, „Aspose.OCR for Java“ greitai tampa OCR programine įranga kūrėjams, norintiems prie savo „Java“ programų pridėti OCR funkcijų.
Pradžia su Aspose.OCR, skirta Java
Rekomenduojamas būdas įdiegti „Aspose.OCR“, skirtą „Java“, yra naudoti „Maven Repository“. Norėdami sklandžiai įdiegti, naudokite šią komandą.
Įdiekite „Aspose.OCR“, skirtą „Java“, naudodami „Maven“ saugyklą
<repositories>
<repository>
<Id>AsposeJavaAPI</Id>
<name>Aspose Java API;/name>
<url>http://repository.aspose.com/repo/</url>
</repository>
</repositories>
Biblioteką galite atsisiųsti tiesiogiai iš Aspose.OCR produkto puslapio
Ištraukite tekstą iš vaizdų per Python API
Aspose.OCR for Java įtraukta labai naudingų funkcijų, leidžiančių programinės įrangos kūrėjams išgauti tekstą iš įvairių tipų vaizdų Python programose. Biblioteka palaiko teksto skaitymą iš rastrinių vaizdų, tokių kaip JPEG, PNG, WBMP, BMP, GIF ir daugelis kitų. Yra ir kitų naudingų bibliotekos funkcijų, skirtų teksto ištraukimui, pavyzdžiui, teksto skaitymas iš kelių puslapių TIFF vaizdų, teksto ištraukimas iš pikselių masyvo, vaizdų skaitymas greičiausiu atpažinimo režimu, vienos eilutės atpažinimas, teksto ištraukimas iš kvitų ir daug daugiau. Šiame pavyzdyje parodyta, kaip iš vaizdo išgauti tekstą naudojant Java komandas.
Kaip ištraukti tekstą iš vaizdo naudojant Java API?
AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();
Perskaitykite konkrečias vaizdo sritis naudodami Java API
Aspose.OCR for Java yra naudinga OCR biblioteka, leidžianti programinės įrangos kūrėjams rasti ir skaityti tik tam tikras vaizdo sritis, o ne visą tekstą naudojant kelias Java kodo eilutes. Tai labai naudinga funkcija ir gali būti labai naudinga apdorojant vienodus dokumentus, pvz., vizas, vairuotojo pažymėjimus, asmens tapatybės korteles ir pan. Jis palaiko tokias funkcijas kaip teksto ištraukimas vaizdo stačiakampyje, linijų su koordinatėmis ištraukimas, automatinė žodžių ir eilučių ribojančių laukelių paieška ir daug daugiau. Šiame pavyzdyje parodyta, kaip išgauti tekstą stačiakampyje naudojant Java kodą.
Kaip ištraukti tekstą stačiakampyje naudojant Java API?
AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));
Pasirinkite konkrečias dokumento sritis per Java API
Dokumento vaizde gali būti daug įvairaus turinio blokų, tokių kaip teksto pastraipos, brėžiniai, diagramos, formulės, lentelės, žemėlapiai ir pan. „Aspose.OCR“, skirta „Java“, leidžia programinės įrangos kūrėjams lengvai pasirinkti ir aptikti tam tikras dominančias sritis puslapyje ir jame atlikti OCR operacijas. Biblioteka palaiko automatinį srities aptikimą, taip pat galite jį nepaisyti rankiniu būdu pasirinkdami dominančias sritis. Toliau pateiktame pavyzdyje parodyta, kaip programinės įrangos kūrėjai gali įjungti automatinį dokumentų sričių aptikimą savo Java programose.
Automatinis dokumentų sričių aptikimas naudojant „Java“ API
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");