1. Tuotteet
  2.   OCR
  3.   Java
  4.   Asprise OCR SDK for Java
 
  

Avoimen lähdekoodin Java-kirjasto OCR-tekstin ja kuvankäsittelyyn

Johtava ilmainen Java-kirjasto, jonka avulla ohjelmistokehittäjät voivat lisätä OCR-ominaisuuksia Java-sovelluksiin ja suorittaa tekstintunnistusta skannatuille kuville ja PDF-tiedostoille tekstin purkamiseksi niistä helposti.

Asprise OCR SDK for Java on tehokas avoimen lähdekoodin Java SDK, joka tarjoaa mahdollisuuden suorittaa optista merkintunnistusta (OCR) skannatuille kuville, PDF-tiedostoille ja muille asiakirjoille. Helppokäyttöisen Java API:n ansiosta tämä SDK voi auttaa kehittäjiä lisäämään OCR-ominaisuudet Java-sovelluksiinsa nopeasti ja helposti. OCR on erittäin hyödyllinen tekniikka, jonka avulla tietokoneet voivat tunnistaa kuvissa tai asiakirjoissa olevan tekstin. OCR-ohjelmistolla voidaan muuntaa tekstin skannatut kuvat digitaaliseksi tekstiksi, jota voidaan muokata, etsiä tai käsitellä tietokoneella.

Asprise OCR SDK sisältää useita tärkeitä ominaisuuksia OCR:ään liittyvien toimintojen käsittelyyn, kuten nopean OCR-käsittelyn, useiden kielten tuen, kuvanparannustoiminnon, tunnistetun tekstin eri muodoissa ja monia muita. SDK perustuu kehittyneeseen OCR-tekniikkaan, joka tunnistaa tekstin useilla eri fonteilla ja kielillä. Kirjastoa voidaan käyttää sovellusten kehittämiseen Java-sovelmille, verkkosovelluksille, Swing/JavaFX-komponenteille ja JEE-yrityssovelluksille.

Asprise OCR SDK:n avulla ohjelmistokehittäjät voivat tulostaa tunnistettua tekstiä useissa eri muodoissa, mukaan lukien pelkkä teksti, haettava PDF ja Microsoft Word. SDK tunnistaa tekstiä yli 100 kielellä, mukaan lukien englanti, kiina, japani, arabia ja monet muut. Edistyneen OCR-teknologian, kattavan kielituen ja helppokäyttöisen API:n ansiosta tämä SDK voi auttaa kehittäjiä säästämään aikaa ja vaivaa OCR-sovellusten luomisessa.

Previous Next

Javan Asprise OCR SDK:n käytön aloittaminen

Javan Asprise OCR SDK:n käytön aloittaminen Suositeltava tapa asentaa Asprise OCR SDK for Java on Mavenin käyttö. Käytä seuraavaa komentoa sujuvaan asennukseen.

Maven Dependency for Asprise OCR SDK Javalle


<dependencies>
	<dependency>
	<groupId>com.asprise.ocr</groupId>
	<artifactId>java-ocr-api;/artifactId>
	<version>[15,)</version>
    </dependency>
</dependencies>

Asenna Asprise OCR SDK Javalle GitHubin kautta

 git clone https://github.com/Asprise/java-.net-ocr-api-library  

Pura teksti pelkkää tekstimuotoa Javan kautta

Asprise OCR SDK for Java on tarjonnut täydelliset toiminnot tekstin poimimiseen kuvista vain tekstimuodossa. Kirjaston avulla käyttäjät voivat helposti hakea skannattujen asiakirjojen tai kuvien tekstisisällön ja käyttää sitä jatkokäsittelyyn tai analysointiin. Pelkän tekstin purkutehtävän saavuttamiseksi sinun on ensin ladattava kuva tiedostosta, syöttövirrasta tai URL-osoitteesta ja käytettävä OCR-tunnistusta ladatussa kuvassa API:n avulla. Käytä asianmukaista toimintoa hakeaksesi tunnistetun tekstin pelkkänä tekstinä. Seuraavassa näytetään, kuinka kuva ladataan ja teksti tunnistetaan tavalliseksi tekstiksi, ja tulos tulostetaan konsoliin.

Lataa kuva ja tunnistettu teksti Java-sovellusliittymän kautta

import com.asprise.ocr.Ocr;

public class OCRTest {

    public static void main(String[] args) throws Exception {
        
        // Load image from file
        Ocr ocr = new Ocr();
        ocr.startEngine("eng", Ocr.SPEED_FASTEST);
        String recognizedText = ocr.recognize(new File("image.png"), Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

        // Print the plain text output
        System.out.println("Recognized Text: " + recognizedText);

        ocr.stopEngine();
    }
}

Suorita erilaisia OCR-toimintoja Java-sovelluksissa

Asprise OCR SDK for Java API antaa ohjelmistokehittäjille mahdollisuuden suorittaa erilaisia OCR (Optical Character Recognition) -toimintoja erityyppisille asiakirjoille. Kirjasto tukee täysin erilaisia OCR-toimintoja, kuten OCR-kuvatiedostoja, OCR PDF-tiedostoja, OCR käsinkirjoitettua tekstiä, OCR useita kieliä, suorittaa tekstintunnistusta osalle kuvasta, suorittaa tekstintunnistusta useille syöttötiedostoille yhdellä kertaa, suorittaa OCR tietty sivu määritetystä TIFF-tiedostosta, OCR-eräkäsittely ja paljon muuta. Kirjasto tarjoaa tehokkaan ja joustavan työkalun OCR-toimintojen suorittamiseen erityyppisille asiakirjoille. Useiden kielten, kuva- ja PDF-tiedostojen, käsinkirjoitetun tekstin ja eräkäsittelyn tuen ansiosta voit nopeasti ja tarkasti poimia tekstiä asiakirjoistasi.

Suorita OCR useille tiedostoille Java-kirjaston kautta

String s = ocr.recognize("test.png;test2.jpg", -1, 0, 0, 400, 200,
   Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

perform OCR on a PDF input file:
String s = ocr.recognize("test.pdf", -1, 100, 100, 400, 200,
   Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

Monisäikeinen tuki Asprise OCR:n avulla

Asprise OCR SDK for Java API sisältää täydellisen tuen monisäikeisyydelle, jonka avulla kehittäjät voivat käsitellä useita OCR-tehtäviä samanaikaisesti. Tämän ominaisuuden avulla kehittäjät voivat parantaa OCR-sovellustensa suorituskykyä jakamalla OCR-käsittelyn useille säikeille, jotka voivat toimia samanaikaisesti useissa ytimissä tai prosessoreissa. Monisäikeinen tuki on erittäin muokattavissa, joten kehittäjät voivat hienosäätää säikeiden ja OCR-koneiden määrää vastaamaan käytettävissä olevia resursseja ja käsittelyvaatimuksia. Pääosin Asprise OCR SDK Java:n monisäikeinen tuki tarjoaa kehittäjille tehokkaan ja joustavan työkalun tehokkaiden OCR-sovellusten rakentamiseen, jotka voivat käsitellä suuria tekstimääriä nopeasti ja tehokkaasti.

Huikean ketjunhallintakoodin kirjoittaminen

OcrExecutorService oes =
  new OcrExecutorService("eng", Ocr.SPEED_FASTEST, 4); // 4 threads

List> futures = oes.invokeAll(Arrays.asList(
  new OcrExecutorService.OcrCallable(
    new File[] {new File("test1.png")},
      Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML),
  new OcrExecutorService.OcrCallable(
    new File[] {new File("test2.png")},
      Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML)
);

System.out.println("Result of test1.png: " + futures.get(0).get());
System.out.println("Result of test2.png: " + futures.get(1).get());

oes.shutdown(); // stops all OCR engines and disposes all threads
 Suomen