1. Produkter
  2.   OCR
  3.   Java
  4.   Asprise OCR SDK for Java
 
  

Open Source Java-bibliotek til OCR-tekst- og billedbehandling

Et førende gratis Java-bibliotek, der giver softwareudviklere mulighed for at tilføje OCR-funktioner til Java-apps og udføre OCR på scannede billeder og PDF-filer for nemt at udtrække tekst fra dem.

Asprise OCR SDK til Java er en kraftfuld open source Java SDK, der giver mulighed for at udføre optisk tegngenkendelse (OCR) på scannede billeder, PDF-filer og andre dokumenter. Med sin brugervenlige Java API kan denne SDK hjælpe udviklere med at tilføje OCR-funktioner til deres Java-applikationer hurtigt og nemt. OCR er en meget nyttig teknologi, der gør det muligt for computere at genkende tekst i billeder eller dokumenter. OCR-softwaren kan bruges til at konvertere scannede billeder af tekst til digital tekst, der kan redigeres, søges i eller behandles af en computer.

Asprise OCR SDK har inkluderet flere vigtige funktioner til håndtering af OCR-relaterede aktiviteter, såsom hurtig OCR-behandling, understøttelse af flere sprog, en billedforbedringsfacilitet, genkendt tekst i en række forskellige formater og mange flere. SDK'et er baseret på avanceret OCR-teknologi, der kan genkende tekst i en lang række forskellige skrifttyper og sprog. Biblioteket kan bruges til at udvikle applikationer til Java-applets, webapplikationer, Swing/JavaFX-komponenter og JEE enterprise-applikationer.

Asprise OCR SDK giver softwareudviklere mulighed for at udskrive genkendt tekst i en række forskellige formater, herunder almindelig tekst, søgbar PDF og Microsoft Word. SDK'et kan genkende tekst på over 100 sprog, inklusive engelsk, kinesisk, japansk, arabisk og mange flere. Med sin avancerede OCR-teknologi, omfattende sprogunderstøttelse og brugervenlige API kan denne SDK hjælpe udviklere med at spare tid og kræfter, når de bygger OCR-applikationer.

Previous Next

Kom godt i gang med Asprise OCR SDK til Java

Kom godt i gang med Asprise OCR SDK til Java Den anbefalede måde at installere Asprise OCR SDK til Java på er at bruge Maven. Brug venligst følgende kommando for en problemfri installation.

Maven Dependency til Asprise OCR SDK til Java


<dependencies>
	<dependency>
	<groupId>com.asprise.ocr</groupId>
	<artifactId>java-ocr-api;/artifactId>
	<version>[15,)</version>
    </dependency>
</dependencies>

Installer Asprise OCR SDK til Java via GitHub

 git clone https://github.com/Asprise/java-.net-ocr-api-library  

Udtræk tekst i almindeligt tekstformat via Java

Asprise OCR SDK til Java har leveret komplet funktionalitet til at udtrække tekst fra billeder i almindeligt tekstformat. Biblioteket giver brugerne mulighed for nemt at hente tekstindholdet i scannede dokumenter eller billeder og bruge det til yderligere behandling eller analyse. For at opnå almindelig tekstudtrækningsopgaven skal du først indlæse billedet fra en fil, inputstrøm eller URL og anvende OCR-genkendelse på det indlæste billede ved hjælp af API'en. Brug den relevante funktion til at hente den genkendte tekst i almindeligt tekstformat. Det følgende viser, hvordan man indlæser et billede og genkendt tekst som almindelig tekst, og resultatet udskrives til konsollen.

Indlæs billede og genkendt tekst via Java API

import com.asprise.ocr.Ocr;

public class OCRTest {

    public static void main(String[] args) throws Exception {
        
        // Load image from file
        Ocr ocr = new Ocr();
        ocr.startEngine("eng", Ocr.SPEED_FASTEST);
        String recognizedText = ocr.recognize(new File("image.png"), Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

        // Print the plain text output
        System.out.println("Recognized Text: " + recognizedText);

        ocr.stopEngine();
    }
}

Udfør forskellige OCR-operationer i Java-apps

Asprise OCR SDK til Java API giver softwareudviklere mulighed for at udføre forskellige OCR-operationer (Optical Character Recognition) på forskellige typer dokumenter. Biblioteket understøtter fuldt ud forskellige typer OCR-operationer, såsom OCR-billedfiler, OCR PDF-filer, OCR håndskrevet tekst, OCR flere sprog, udføre OCR på en del af billedet, udføre OCR på flere inputfiler i ét skud, udføre OCR på en bestemt side fra den angivne TIFF-fil, OCR Batch Processing og mange flere. Biblioteket giver et kraftfuldt og fleksibelt værktøj til at udføre OCR-operationer på forskellige typer dokumenter. Med dens understøttelse af flere sprog, billed- og PDF-filer, håndskrevet tekst og batchbehandling kan du hurtigt og præcist udtrække tekst fra dine dokumenter.

Udfør OCR på flere filer via Java Library

String s = ocr.recognize("test.png;test2.jpg", -1, 0, 0, 400, 200,
   Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

perform OCR on a PDF input file:
String s = ocr.recognize("test.pdf", -1, 100, 100, 400, 200,
   Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

Multi-threading Support ved hjælp af Asprise OCR

Asprise OCR SDK til Java API har inkluderet komplet understøttelse af multi-threading, som giver udviklere mulighed for at behandle flere OCR-opgaver samtidigt. Denne funktion gør det muligt for udviklere at forbedre ydeevnen af deres OCR-applikationer ved at distribuere OCR-behandling på tværs af flere tråde, som kan køre samtidigt på flere kerner eller processorer. Multi-threading-understøttelsen er meget tilpasselig, hvilket giver udviklere mulighed for at finjustere antallet af tråde og OCR-motorer, så de matcher de tilgængelige ressourcer og behandlingskrav. I det store og hele giver Asprise OCR SDK til Javas multi-threading-understøttelse udviklere et kraftfuldt og fleksibelt værktøj til at bygge højtydende OCR-applikationer, der kan behandle store mængder tekst hurtigt og effektivt.

Skriv en vanskelig trådstyringskode

OcrExecutorService oes =
  new OcrExecutorService("eng", Ocr.SPEED_FASTEST, 4); // 4 threads

List> futures = oes.invokeAll(Arrays.asList(
  new OcrExecutorService.OcrCallable(
    new File[] {new File("test1.png")},
      Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML),
  new OcrExecutorService.OcrCallable(
    new File[] {new File("test2.png")},
      Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML)
);

System.out.println("Result of test1.png: " + futures.get(0).get());
System.out.println("Result of test2.png: " + futures.get(1).get());

oes.shutdown(); // stops all OCR engines and disposes all threads
 Dansk