1. Termékek
  2.   OCR
  3.   Java
  4.   Asprise OCR SDK for Java
 
  

Nyílt forráskódú Java könyvtár az OCR szöveg- és képfeldolgozáshoz

Vezető ingyenes Java-könyvtár, amely lehetővé teszi a szoftverfejlesztők számára, hogy OCR-képességeket adjanak a Java-alkalmazásokhoz, és OCR-t hajtsanak végre a beolvasott képeken és PDF-fájlokon, hogy könnyedén kivonhassanak belőlük szöveget.

Az Asprise OCR SDK for Java egy hatékony, nyílt forráskódú Java SDK, amely optikai karakterfelismerést (OCR) biztosít beolvasott képeken, PDF-fájlokon és egyéb dokumentumokon. Könnyen használható Java API-jával ez az SDK segíthet a fejlesztőknek abban, hogy gyorsan és egyszerűen OCR-képességeket adjanak Java-alkalmazásaikhoz. Az OCR egy nagyon hasznos technológia, amely lehetővé teszi a számítógépek számára a képek vagy dokumentumok szövegének felismerését. Az OCR-szoftver használható a szöveg beolvasott képeinek digitális szöveggé alakítására, amely szerkeszthető, kereshető vagy számítógéppel feldolgozható.

Az Asprise OCR SDK számos fontos funkciót tartalmaz az OCR-hez kapcsolódó tevékenységek kezeléséhez, például gyors OCR-feldolgozást, több nyelv támogatását, képjavító szolgáltatást, felismert szöveget különféle formátumokban és még sok mást. Az SDK fejlett OCR technológián alapul, amely a betűtípusok és nyelvek széles skáláján képes felismerni a szöveget. A könyvtár használható alkalmazások fejlesztésére Java kisalkalmazásokhoz, webes alkalmazásokhoz, Swing/JavaFX komponensekhez és JEE vállalati alkalmazásokhoz.

Az Asprise OCR SDK lehetővé teszi a szoftverfejlesztők számára, hogy felismert szöveget különféle formátumokban adjanak ki, beleértve az egyszerű szöveget, a kereshető PDF-t és a Microsoft Word-t. Az SDK több mint 100 nyelven képes felismerni a szöveget, köztük angolul, kínaiul, japánul, arabul és még sok más nyelven. Fejlett OCR-technológiájával, átfogó nyelvi támogatásával és könnyen használható API-jával ez az SDK segíthet a fejlesztőknek időt és erőfeszítést megtakarítani az OCR-alkalmazások készítése során.

Previous Next

Kezdő lépések a Java Asprise OCR SDK-val

Az Asprise OCR SDK for Java használatának első lépései Az Asprise OCR SDK for Java telepítésének javasolt módja a Maven használata. Kérjük, használja a következő parancsot a zökkenőmentes telepítés érdekében.

Maven Dependency for Asprise OCR SDK for Java


<dependencies>
	<dependency>
	<groupId>com.asprise.ocr</groupId>
	<artifactId>java-ocr-api;/artifactId>
	<version>[15,)</version>
    </dependency>
</dependencies>

Az Asprise OCR SDK for Java telepítése a GitHubon keresztül

 git clone https://github.com/Asprise/java-.net-ocr-api-library  

Szöveg kibontása egyszerű szöveges formátumban Java segítségével

Az Asprise OCR SDK for Java teljes funkcionalitást biztosít a szövegek egyszerű szöveges formátumban történő kivonásához. A könyvtár lehetővé teszi a felhasználók számára, hogy a beolvasott dokumentumok vagy képek szöveges tartalmát egyszerűen lekérjék, és további feldolgozásra vagy elemzésre felhasználják. Az egyszerű szöveg kinyerési feladatának eléréséhez először be kell töltenie a képet egy fájlból, bemeneti adatfolyamból vagy URL-ből, és az API segítségével OCR-felismerést kell alkalmaznia a betöltött képre. A felismert szöveg egyszerű szöveges formátumban történő lekéréséhez használja a megfelelő funkciót. Az alábbiakban bemutatjuk, hogyan kell betölteni egy képet, és a felismert szöveget egyszerű szövegként, és az eredményt a rendszer kinyomtatja a konzolra.

Kép és felismert szöveg betöltése Java API-n keresztül

import com.asprise.ocr.Ocr;

public class OCRTest {

    public static void main(String[] args) throws Exception {
        
        // Load image from file
        Ocr ocr = new Ocr();
        ocr.startEngine("eng", Ocr.SPEED_FASTEST);
        String recognizedText = ocr.recognize(new File("image.png"), Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

        // Print the plain text output
        System.out.println("Recognized Text: " + recognizedText);

        ocr.stopEngine();
    }
}

Különféle OCR-műveletek végrehajtása Java alkalmazásokban

Az Asprise OCR SDK for Java API lehetővé teszi a szoftverfejlesztők számára, hogy különféle OCR (optikai karakterfelismerés) műveleteket hajtsanak végre különböző típusú dokumentumokon. A könyvtár teljes mértékben támogatja a különböző típusú OCR műveleteket, például az OCR képfájlokat, az OCR PDF fájlokat, az OCR kézzel írt szöveget, az OCR több nyelvet, az OCR végrehajtását a kép egy részén, az OCR végrehajtását több bemeneti fájlon egy felvételen, az OCR végrehajtását egy bizonyos oldalakat a megadott TIFF fájlból, OCR kötegelt feldolgozást és még sok mást. A könyvtár hatékony és rugalmas eszközt biztosít az OCR műveletek végrehajtásához különféle típusú dokumentumokon. Több nyelv, kép- és PDF-fájlok, kézzel írt szövegek és kötegelt feldolgozás támogatásával gyorsan és pontosan kinyerhet szöveget a dokumentumokból.

Végezzen OCR-t több fájlon a Java Library segítségével

String s = ocr.recognize("test.png;test2.jpg", -1, 0, 0, 400, 200,
   Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

perform OCR on a PDF input file:
String s = ocr.recognize("test.pdf", -1, 100, 100, 400, 200,
   Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

Többszálú támogatás az Asprise OCR használatával

Az Asprise OCR SDK for Java API teljes mértékben támogatja a többszálú feldolgozást, amely lehetővé teszi a fejlesztők számára, hogy több OCR-feladatot dolgozzanak fel egyidejűleg. Ez a funkció lehetővé teszi a fejlesztők számára, hogy javítsák OCR-alkalmazásaik teljesítményét azáltal, hogy az OCR-feldolgozást több szálon osztják el, amelyek egyidejűleg több magon vagy processzoron futhatnak. A többszálú támogatás nagymértékben testreszabható, lehetővé téve a fejlesztők számára, hogy finomhangolják a szálak számát és az OCR-motorokat, hogy megfeleljenek a rendelkezésre álló erőforrásoknak és a feldolgozási követelményeknek. Az Asprise OCR SDK for Java többszálas támogatása nagyrészt hatékony és rugalmas eszközt biztosít a fejlesztőknek a nagy mennyiségű szöveg gyors és hatékony feldolgozására képes, nagy teljesítményű OCR-alkalmazások készítéséhez.

Trükkös szálkezelési kód írása

OcrExecutorService oes =
  new OcrExecutorService("eng", Ocr.SPEED_FASTEST, 4); // 4 threads

List> futures = oes.invokeAll(Arrays.asList(
  new OcrExecutorService.OcrCallable(
    new File[] {new File("test1.png")},
      Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML),
  new OcrExecutorService.OcrCallable(
    new File[] {new File("test2.png")},
      Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML)
);

System.out.println("Result of test1.png: " + futures.get(0).get());
System.out.println("Result of test2.png: " + futures.get(1).get());

oes.shutdown(); // stops all OCR engines and disposes all threads
 Magyar