Nyílt forráskódú Java könyvtár az OCR szöveg- és képfeldolgozáshoz
Vezető ingyenes Java-könyvtár, amely lehetővé teszi a szoftverfejlesztők számára, hogy OCR-képességeket adjanak a Java-alkalmazásokhoz, és OCR-t hajtsanak végre a beolvasott képeken és PDF-fájlokon, hogy könnyedén kivonhassanak belőlük szöveget.
Az Asprise OCR SDK for Java egy hatékony, nyílt forráskódú Java SDK, amely optikai karakterfelismerést (OCR) biztosít beolvasott képeken, PDF-fájlokon és egyéb dokumentumokon. Könnyen használható Java API-jával ez az SDK segíthet a fejlesztőknek abban, hogy gyorsan és egyszerűen OCR-képességeket adjanak Java-alkalmazásaikhoz. Az OCR egy nagyon hasznos technológia, amely lehetővé teszi a számítógépek számára a képek vagy dokumentumok szövegének felismerését. Az OCR-szoftver használható a szöveg beolvasott képeinek digitális szöveggé alakítására, amely szerkeszthető, kereshető vagy számítógéppel feldolgozható.
Az Asprise OCR SDK számos fontos funkciót tartalmaz az OCR-hez kapcsolódó tevékenységek kezeléséhez, például gyors OCR-feldolgozást, több nyelv támogatását, képjavító szolgáltatást, felismert szöveget különféle formátumokban és még sok mást. Az SDK fejlett OCR technológián alapul, amely a betűtípusok és nyelvek széles skáláján képes felismerni a szöveget. A könyvtár használható alkalmazások fejlesztésére Java kisalkalmazásokhoz, webes alkalmazásokhoz, Swing/JavaFX komponensekhez és JEE vállalati alkalmazásokhoz.
Az Asprise OCR SDK lehetővé teszi a szoftverfejlesztők számára, hogy felismert szöveget különféle formátumokban adjanak ki, beleértve az egyszerű szöveget, a kereshető PDF-t és a Microsoft Word-t. Az SDK több mint 100 nyelven képes felismerni a szöveget, köztük angolul, kínaiul, japánul, arabul és még sok más nyelven. Fejlett OCR-technológiájával, átfogó nyelvi támogatásával és könnyen használható API-jával ez az SDK segíthet a fejlesztőknek időt és erőfeszítést megtakarítani az OCR-alkalmazások készítése során.
Kezdő lépések a Java Asprise OCR SDK-val
Az Asprise OCR SDK for Java használatának első lépései Az Asprise OCR SDK for Java telepítésének javasolt módja a Maven használata. Kérjük, használja a következő parancsot a zökkenőmentes telepítés érdekében.
Maven Dependency for Asprise OCR SDK for Java
<dependencies>
<dependency>
<groupId>com.asprise.ocr</groupId>
<artifactId>java-ocr-api;/artifactId>
<version>[15,)</version>
</dependency>
</dependencies>
Az Asprise OCR SDK for Java telepítése a GitHubon keresztül
git clone https://github.com/Asprise/java-.net-ocr-api-library
Szöveg kibontása egyszerű szöveges formátumban Java segítségével
Az Asprise OCR SDK for Java teljes funkcionalitást biztosít a szövegek egyszerű szöveges formátumban történő kivonásához. A könyvtár lehetővé teszi a felhasználók számára, hogy a beolvasott dokumentumok vagy képek szöveges tartalmát egyszerűen lekérjék, és további feldolgozásra vagy elemzésre felhasználják. Az egyszerű szöveg kinyerési feladatának eléréséhez először be kell töltenie a képet egy fájlból, bemeneti adatfolyamból vagy URL-ből, és az API segítségével OCR-felismerést kell alkalmaznia a betöltött képre. A felismert szöveg egyszerű szöveges formátumban történő lekéréséhez használja a megfelelő funkciót. Az alábbiakban bemutatjuk, hogyan kell betölteni egy képet, és a felismert szöveget egyszerű szövegként, és az eredményt a rendszer kinyomtatja a konzolra.
Kép és felismert szöveg betöltése Java API-n keresztül
import com.asprise.ocr.Ocr;
public class OCRTest {
public static void main(String[] args) throws Exception {
// Load image from file
Ocr ocr = new Ocr();
ocr.startEngine("eng", Ocr.SPEED_FASTEST);
String recognizedText = ocr.recognize(new File("image.png"), Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);
// Print the plain text output
System.out.println("Recognized Text: " + recognizedText);
ocr.stopEngine();
}
}
Különféle OCR-műveletek végrehajtása Java alkalmazásokban
Az Asprise OCR SDK for Java API lehetővé teszi a szoftverfejlesztők számára, hogy különféle OCR (optikai karakterfelismerés) műveleteket hajtsanak végre különböző típusú dokumentumokon. A könyvtár teljes mértékben támogatja a különböző típusú OCR műveleteket, például az OCR képfájlokat, az OCR PDF fájlokat, az OCR kézzel írt szöveget, az OCR több nyelvet, az OCR végrehajtását a kép egy részén, az OCR végrehajtását több bemeneti fájlon egy felvételen, az OCR végrehajtását egy bizonyos oldalakat a megadott TIFF fájlból, OCR kötegelt feldolgozást és még sok mást. A könyvtár hatékony és rugalmas eszközt biztosít az OCR műveletek végrehajtásához különféle típusú dokumentumokon. Több nyelv, kép- és PDF-fájlok, kézzel írt szövegek és kötegelt feldolgozás támogatásával gyorsan és pontosan kinyerhet szöveget a dokumentumokból.
Végezzen OCR-t több fájlon a Java Library segítségével
String s = ocr.recognize("test.png;test2.jpg", -1, 0, 0, 400, 200,
Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);
perform OCR on a PDF input file:
String s = ocr.recognize("test.pdf", -1, 100, 100, 400, 200,
Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);
Többszálú támogatás az Asprise OCR használatával
Az Asprise OCR SDK for Java API teljes mértékben támogatja a többszálú feldolgozást, amely lehetővé teszi a fejlesztők számára, hogy több OCR-feladatot dolgozzanak fel egyidejűleg. Ez a funkció lehetővé teszi a fejlesztők számára, hogy javítsák OCR-alkalmazásaik teljesítményét azáltal, hogy az OCR-feldolgozást több szálon osztják el, amelyek egyidejűleg több magon vagy processzoron futhatnak. A többszálú támogatás nagymértékben testreszabható, lehetővé téve a fejlesztők számára, hogy finomhangolják a szálak számát és az OCR-motorokat, hogy megfeleljenek a rendelkezésre álló erőforrásoknak és a feldolgozási követelményeknek. Az Asprise OCR SDK for Java többszálas támogatása nagyrészt hatékony és rugalmas eszközt biztosít a fejlesztőknek a nagy mennyiségű szöveg gyors és hatékony feldolgozására képes, nagy teljesítményű OCR-alkalmazások készítéséhez.
Trükkös szálkezelési kód írása
OcrExecutorService oes =
new OcrExecutorService("eng", Ocr.SPEED_FASTEST, 4); // 4 threads
List> futures = oes.invokeAll(Arrays.asList(
new OcrExecutorService.OcrCallable(
new File[] {new File("test1.png")},
Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML),
new OcrExecutorService.OcrCallable(
new File[] {new File("test2.png")},
Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML)
);
System.out.println("Result of test1.png: " + futures.get(0).get());
System.out.println("Result of test2.png: " + futures.get(1).get());
oes.shutdown(); // stops all OCR engines and disposes all threads