1. Produkter
  2.   OCR
  3.   Java
  4.   Asprise OCR SDK for Java
 
  

Open Source Java Library för OCR-text- och bildbehandling

Ett ledande gratis Java-bibliotek som låter mjukvaruutvecklare lägga till OCR-funktioner till Java-appar och utföra OCR på skannade bilder och PDF-filer för att enkelt extrahera text från dem.

Asprise OCR SDK för Java är ett kraftfullt Java SDK med öppen källkod som ger möjlighet att utföra optisk teckenigenkänning (OCR) på skannade bilder, PDF-filer och andra dokument. Med sitt lättanvända Java API kan denna SDK hjälpa utvecklare att lägga till OCR-funktioner till sina Java-applikationer snabbt och enkelt. OCR är en mycket användbar teknik som gör det möjligt för datorer att känna igen text i bilder eller dokument. OCR-programvaran kan användas för att konvertera skannade bilder av text till digital text som kan redigeras, sökas i eller bearbetas av en dator.

Asprise OCR SDK har inkluderat flera viktiga funktioner för att hantera OCR-relaterade aktiviteter, såsom snabb OCR-bearbetning, stöd för flera språk, en bildförbättringsfunktion, igenkänd text i en mängd olika format och många fler. SDK:n är baserad på avancerad OCR-teknik som kan känna igen text i en mängd olika typsnitt och språk. Biblioteket kan användas för att utveckla applikationer för Java-applets, webbapplikationer, Swing/JavaFX-komponenter och JEE-företagsapplikationer.

Asprise OCR SDK tillåter mjukvaruutvecklare att mata ut igenkänd text i en mängd olika format, inklusive vanlig text, sökbar PDF och Microsoft Word. SDK:n kan känna igen text på över 100 språk, inklusive engelska, kinesiska, japanska, arabiska och många fler. Med sin avancerade OCR-teknik, omfattande språkstöd och lättanvända API kan denna SDK hjälpa utvecklare att spara tid och ansträngning när de bygger OCR-applikationer.

Previous Next

Komma igång med Asprise OCR SDK för Java

Komma igång med Asprise OCR SDK för Java Det rekommenderade sättet att installera Asprise OCR SDK för Java är att använda Maven. Använd följande kommando för en smidig installation.

Maven Dependency för Asprise OCR SDK för Java


<dependencies>
	<dependency>
	<groupId>com.asprise.ocr</groupId>
	<artifactId>java-ocr-api;/artifactId>
	<version>[15,)</version>
    </dependency>
</dependencies>

Installera Asprise OCR SDK för Java via GitHub

 git clone https://github.com/Asprise/java-.net-ocr-api-library  

Extrahera text i vanlig textformat via Java

Asprise OCR SDK för Java har tillhandahållit komplett funktionalitet för att extrahera text från bilder i vanligt textformat. Biblioteket låter användare enkelt hämta textinnehållet i skannade dokument eller bilder och använda det för vidare bearbetning eller analys. För att utföra uppgiften att extrahera vanlig text måste du först ladda bilden från en fil, inmatningsström eller URL och tillämpa OCR-igenkänning på den laddade bilden med hjälp av API:et. Använd lämplig funktion för att hämta den igenkända texten i vanlig textformat. Följande visar hur man laddar en bild och igenkänd text som vanlig text, och resultatet skrivs ut till konsolen.

Ladda in bild och igenkänd text via Java API

import com.asprise.ocr.Ocr;

public class OCRTest {

    public static void main(String[] args) throws Exception {
        
        // Load image from file
        Ocr ocr = new Ocr();
        ocr.startEngine("eng", Ocr.SPEED_FASTEST);
        String recognizedText = ocr.recognize(new File("image.png"), Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

        // Print the plain text output
        System.out.println("Recognized Text: " + recognizedText);

        ocr.stopEngine();
    }
}

Utför olika OCR-operationer i Java-appar

Asprise OCR SDK för Java API tillåter mjukvaruutvecklare att utföra olika OCR-operationer (Optical Character Recognition) på olika typer av dokument. Biblioteket stöder fullt ut olika typer av OCR-operationer, såsom OCR-bildfiler, OCR PDF-filer, OCR handskriven text, OCR flera språk, utför OCR på en del av bilden, utför OCR på flera indatafiler i en bild, utför OCR på en viss sida från den angivna TIFF-filen, OCR Batch Processing och många fler. Biblioteket tillhandahåller ett kraftfullt och flexibelt verktyg för att utföra OCR-operationer på olika typer av dokument. Med stöd för flera språk, bild- och PDF-filer, handskriven text och batchbearbetning kan du snabbt och exakt extrahera text från dina dokument.

Utför OCR på flera filer via Java Library

String s = ocr.recognize("test.png;test2.jpg", -1, 0, 0, 400, 200,
   Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

perform OCR on a PDF input file:
String s = ocr.recognize("test.pdf", -1, 100, 100, 400, 200,
   Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

Multi-threading Support med Asprise OCR

Asprise OCR SDK för Java API har inkluderat komplett stöd för multi-threading, vilket gör att utvecklare kan bearbeta flera OCR-uppgifter samtidigt. Denna funktion gör det möjligt för utvecklare att förbättra prestanda för sina OCR-applikationer genom att distribuera OCR-bearbetning över flera trådar, som kan köras samtidigt på flera kärnor eller processorer. Stödet för flera trådar är mycket anpassningsbart, vilket gör att utvecklare kan finjustera antalet trådar och OCR-motorer för att matcha de tillgängliga resurserna och bearbetningskraven. Till stor del ger Asprise OCR SDK för Javas stöd för flera trådar utvecklare ett kraftfullt och flexibelt verktyg för att bygga högpresterande OCR-applikationer som kan bearbeta stora volymer text snabbt och effektivt.

Skriva knepig trådhanteringskod

OcrExecutorService oes =
  new OcrExecutorService("eng", Ocr.SPEED_FASTEST, 4); // 4 threads

List> futures = oes.invokeAll(Arrays.asList(
  new OcrExecutorService.OcrCallable(
    new File[] {new File("test1.png")},
      Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML),
  new OcrExecutorService.OcrCallable(
    new File[] {new File("test2.png")},
      Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML)
);

System.out.println("Result of test1.png: " + futures.get(0).get());
System.out.println("Result of test2.png: " + futures.get(1).get());

oes.shutdown(); // stops all OCR engines and disposes all threads
 Svenska