Atvirojo kodo Java biblioteka, skirta OCR teksto ir vaizdo apdorojimui
Pirmaujanti nemokama „Java“ biblioteka, leidžianti programinės įrangos kūrėjams pridėti OCR galimybes prie „Java“ programų ir atlikti nuskaitytų vaizdų ir PDF failų OCR, kad būtų galima lengvai ištraukti iš jų tekstą.
Asprise OCR SDK, skirta Java, yra galingas atvirojo kodo Java SDK, suteikiantis galimybę atlikti nuskaitytų vaizdų, PDF failų ir kitų dokumentų optinį simbolių atpažinimą (OCR). Dėl savo lengvai naudojamo Java API šis SDK gali padėti kūrėjams greitai ir lengvai pridėti OCR galimybes prie savo Java programų. OCR yra labai naudinga technologija, leidžianti kompiuteriams atpažinti tekstą vaizduose ar dokumentuose. OCR programinė įranga gali būti naudojama konvertuoti nuskaitytus teksto vaizdus į skaitmeninį tekstą, kurį galima redaguoti, ieškoti arba apdoroti kompiuteriu.
Asprise OCR SDK apima keletą svarbių funkcijų, skirtų su OCR susijusiai veiklai tvarkyti, pvz., greitas OCR apdorojimas, kelių kalbų palaikymas, vaizdo patobulinimo priemonė, atpažįstamas tekstas įvairiais formatais ir daug daugiau. SDK yra pagrįstas pažangia OCR technologija, kuri gali atpažinti tekstą įvairiais šriftais ir kalbomis. Biblioteka gali būti naudojama kuriant programas Java programėlėms, žiniatinklio programoms, Swing/JavaFX komponentams ir JEE įmonės programoms.
Asprise OCR SDK leidžia programinės įrangos kūrėjams išvesti atpažintą tekstą įvairiais formatais, įskaitant paprastą tekstą, PDF su paieška ir Microsoft Word. SDK gali atpažinti tekstą daugiau nei 100 kalbų, įskaitant anglų, kinų, japonų, arabų ir daug kitų. Dėl pažangios OCR technologijos, visapusiško kalbos palaikymo ir lengvai naudojamo API šis SDK gali padėti kūrėjams sutaupyti laiko ir pastangų kuriant OCR programas.
Darbo su Asprise OCR SDK skirta Java pradžia
Pradžia su „Asprise OCR SDK“, skirta „Java“. Rekomenduojamas būdas įdiegti „Asprise OCR SDK“, skirtą „Java“, yra naudoti „Maven“. Norėdami sklandžiai įdiegti, naudokite šią komandą.
Maven Dependency for Asprise OCR SDK, skirta Java
<dependencies>
<dependency>
<groupId>com.asprise.ocr</groupId>
<artifactId>java-ocr-api;/artifactId>
<version>[15,)</version>
</dependency>
</dependencies>
Įdiekite „Asprise OCR SDK“, skirtą „Java“, naudodami „GitHub“
git clone https://github.com/Asprise/java-.net-ocr-api-library
Ištraukite tekstą paprastojo teksto formatu per Java
Asprise OCR SDK, skirta „Java“, suteikė visas funkcijas, skirtas teksto ištraukimui iš vaizdų paprasto teksto formatu. Biblioteka leidžia vartotojams lengvai gauti nuskaitytų dokumentų ar vaizdų tekstinį turinį ir naudoti jį tolesniam apdorojimui ar analizei. Norėdami atlikti paprasto teksto išskleidimo užduotį, pirmiausia turite įkelti vaizdą iš failo, įvesties srauto arba URL ir pritaikyti OCR atpažinimą įkeltam vaizdui naudodami API. Norėdami gauti atpažintą tekstą paprastojo teksto formatu, naudokite atitinkamą funkciją. Toliau parodyta, kaip įkelti vaizdą ir atpažinti tekstą kaip paprastą tekstą, o rezultatas išspausdinamas konsolėje.
Įkelti vaizdą ir atpažintą tekstą per Java API
import com.asprise.ocr.Ocr;
public class OCRTest {
public static void main(String[] args) throws Exception {
// Load image from file
Ocr ocr = new Ocr();
ocr.startEngine("eng", Ocr.SPEED_FASTEST);
String recognizedText = ocr.recognize(new File("image.png"), Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);
// Print the plain text output
System.out.println("Recognized Text: " + recognizedText);
ocr.stopEngine();
}
}
Atlikite įvairias OCR operacijas „Java Apps“
Asprise OCR SDK, skirta Java API, leidžia programinės įrangos kūrėjams atlikti įvairias OCR (optinio simbolių atpažinimo) operacijas su skirtingų tipų dokumentais. Biblioteka visiškai palaiko įvairių tipų OCR operacijas, tokias kaip OCR vaizdo failai, OCR PDF failai, OCR ranka rašytas tekstas, OCR kelios kalbos, atlikti OCR dalį vaizdo, atlikti OCR su keliais įvesties failais vienu kadru, atlikti OCR tam tikras puslapis iš nurodyto TIFF failo, OCR paketinis apdorojimas ir daug daugiau. Biblioteka yra galingas ir lankstus įrankis OCR operacijoms atlikti su įvairių tipų dokumentais. Palaikydami kelias kalbas, vaizdų ir PDF failus, ranka rašytą tekstą ir paketinį apdorojimą, galite greitai ir tiksliai išgauti tekstą iš savo dokumentų.
Atlikite OCR keliems failams naudodami „Java“ biblioteką
String s = ocr.recognize("test.png;test2.jpg", -1, 0, 0, 400, 200,
Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);
perform OCR on a PDF input file:
String s = ocr.recognize("test.pdf", -1, 100, 100, 400, 200,
Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);
Kelių gijų palaikymas naudojant Asprise OCR
Asprise OCR SDK, skirta Java API, apima visišką kelių gijų palaikymą, kuris leidžia kūrėjams vienu metu apdoroti kelias OCR užduotis. Ši funkcija leidžia kūrėjams pagerinti savo OCR programų našumą paskirstant OCR apdorojimą keliose gijose, kurios vienu metu gali veikti keliuose branduoliuose arba procesoriuose. Kelių gijų palaikymas yra labai pritaikomas, todėl kūrėjai gali tiksliai sureguliuoti gijų skaičių ir OCR variklius, kad atitiktų turimus išteklius ir apdorojimo reikalavimus. Daugeliu atvejų „Asprise OCR SDK“, skirta „Java“ kelių gijų palaikymui, kūrėjams suteikia galingą ir lankstų įrankį, leidžiantį kurti didelio našumo OCR programas, kurios gali greitai ir efektyviai apdoroti didelius teksto kiekius.
Sudėtingos gijos valdymo kodo rašymas
OcrExecutorService oes =
new OcrExecutorService("eng", Ocr.SPEED_FASTEST, 4); // 4 threads
List> futures = oes.invokeAll(Arrays.asList(
new OcrExecutorService.OcrCallable(
new File[] {new File("test1.png")},
Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML),
new OcrExecutorService.OcrCallable(
new File[] {new File("test2.png")},
Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML)
);
System.out.println("Result of test1.png: " + futures.get(0).get());
System.out.println("Result of test2.png: " + futures.get(1).get());
oes.shutdown(); // stops all OCR engines and disposes all threads