1. Προϊόντα
  2.   OCR
  3.   Java
  4.   Asprise OCR SDK for Java
 
  

Βιβλιοθήκη Java ανοιχτού κώδικα για επεξεργασία κειμένου και εικόνας OCR

Μια κορυφαία δωρεάν βιβλιοθήκη Java που επιτρέπει στους προγραμματιστές λογισμικού να προσθέτουν δυνατότητες OCR σε εφαρμογές Java και να εκτελούν OCR σε σαρωμένες εικόνες και αρχεία PDF για να εξάγουν κείμενο από αυτές με ευκολία.

Το Asprise OCR SDK για Java είναι ένα ισχυρό Java SDK ανοιχτού κώδικα που παρέχει τη δυνατότητα εκτέλεσης οπτικής αναγνώρισης χαρακτήρων (OCR) σε σαρωμένες εικόνες, αρχεία PDF και άλλα έγγραφα. Με το εύχρηστο Java API, αυτό το SDK μπορεί να βοηθήσει τους προγραμματιστές να προσθέσουν δυνατότητες OCR στις εφαρμογές τους Java γρήγορα και εύκολα. Το OCR είναι μια πολύ χρήσιμη τεχνολογία που επιτρέπει στους υπολογιστές να αναγνωρίζουν κείμενο σε εικόνες ή έγγραφα. Το λογισμικό OCR μπορεί να χρησιμοποιηθεί για τη μετατροπή σαρωμένων εικόνων κειμένου σε ψηφιακό κείμενο που μπορεί να επεξεργαστεί, να αναζητηθεί ή να επεξεργαστεί από υπολογιστή.

Το Asprise OCR SDK έχει συμπεριλάβει πολλές σημαντικές δυνατότητες για το χειρισμό δραστηριοτήτων που σχετίζονται με το OCR, όπως γρήγορη επεξεργασία OCR, υποστήριξη πολλών γλωσσών, δυνατότητα βελτίωσης εικόνας, αναγνωρισμένο κείμενο σε διάφορες μορφές και πολλά άλλα. Το SDK βασίζεται σε προηγμένη τεχνολογία OCR που μπορεί να αναγνωρίσει κείμενο σε μεγάλη ποικιλία γραμματοσειρών και γλωσσών. Η βιβλιοθήκη μπορεί να χρησιμοποιηθεί για την ανάπτυξη εφαρμογών για εφαρμογές Java, εφαρμογές web, στοιχεία Swing/JavaFX και εφαρμογές JEE για επιχειρήσεις.

Το Asprise OCR SDK επιτρέπει στους προγραμματιστές λογισμικού να εξάγουν αναγνωρισμένο κείμενο σε διάφορες μορφές, όπως απλό κείμενο, PDF με δυνατότητα αναζήτησης και Microsoft Word. Το SDK μπορεί να αναγνωρίσει κείμενο σε περισσότερες από 100 γλώσσες, συμπεριλαμβανομένων των Αγγλικών, Κινεζικών, Ιαπωνικών, Αραβικών και πολλών άλλων. Με την προηγμένη τεχνολογία OCR, την ολοκληρωμένη υποστήριξη γλώσσας και το εύχρηστο API, αυτό το SDK μπορεί να βοηθήσει τους προγραμματιστές να εξοικονομήσουν χρόνο και προσπάθεια κατά τη δημιουργία εφαρμογών OCR.

Previous Next

Ξεκινώντας με το Asprise OCR SDK για Java

Ξεκινώντας με το Asprise OCR SDK για Java Ο προτεινόμενος τρόπος εγκατάστασης του Asprise OCR SDK για Java είναι η χρήση του Maven. Χρησιμοποιήστε την ακόλουθη εντολή για ομαλή εγκατάσταση.

Maven Dependency για Asprise OCR SDK για Java


<dependencies>
	<dependency>
	<groupId>com.asprise.ocr</groupId>
	<artifactId>java-ocr-api;/artifactId>
	<version>[15,)</version>
    </dependency>
</dependencies>

Εγκαταστήστε το Asprise OCR SDK για Java μέσω GitHub

 git clone https://github.com/Asprise/java-.net-ocr-api-library  

Εξαγωγή κειμένου σε μορφή απλού κειμένου μέσω Java

Το Asprise OCR SDK για Java παρέχει πλήρη λειτουργικότητα για την εξαγωγή κειμένου από εικόνες σε μορφή απλού κειμένου. Η βιβλιοθήκη επιτρέπει στους χρήστες να ανακτούν εύκολα το περιεχόμενο κειμένου των σαρωμένων εγγράφων ή εικόνων και να το χρησιμοποιούν για περαιτέρω επεξεργασία ή ανάλυση. Για να επιτύχετε την εργασία εξαγωγής απλού κειμένου, πρέπει πρώτα να φορτώσετε την εικόνα από ένα αρχείο, ροή εισόδου ή διεύθυνση URL και να εφαρμόσετε αναγνώριση OCR στη φορτωμένη εικόνα χρησιμοποιώντας το API. Χρησιμοποιήστε την κατάλληλη λειτουργία για να ανακτήσετε το αναγνωρισμένο κείμενο σε μορφή απλού κειμένου. Το παρακάτω δείχνει πώς να φορτώσετε μια εικόνα και το αναγνωρισμένο κείμενο ως απλό κείμενο και το αποτέλεσμα εκτυπώνεται στην κονσόλα.

Φόρτωση εικόνας και αναγνωρισμένου κειμένου μέσω Java API

import com.asprise.ocr.Ocr;

public class OCRTest {

    public static void main(String[] args) throws Exception {
        
        // Load image from file
        Ocr ocr = new Ocr();
        ocr.startEngine("eng", Ocr.SPEED_FASTEST);
        String recognizedText = ocr.recognize(new File("image.png"), Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

        // Print the plain text output
        System.out.println("Recognized Text: " + recognizedText);

        ocr.stopEngine();
    }
}

Εκτελέστε διάφορες λειτουργίες OCR σε εφαρμογές Java

Το Asprise OCR SDK for Java API επιτρέπει στους προγραμματιστές λογισμικού να πραγματοποιούν διάφορες λειτουργίες OCR (Optical Character Recognition) σε διαφορετικούς τύπους εγγράφων. Η βιβλιοθήκη υποστηρίζει πλήρως διαφορετικούς τύπους λειτουργιών OCR, όπως OCR Image Files, OCR PDF Files, OCR Handwritten Text, OCR Multiple Languages, εκτέλεση OCR σε μέρος της εικόνας, εκτέλεση OCR σε πολλαπλά αρχεία εισόδου σε μία λήψη, εκτέλεση OCR σε συγκεκριμένη σελίδα από το καθορισμένο αρχείο TIFF, OCR Batch Processing και πολλά άλλα. Η βιβλιοθήκη παρέχει ένα ισχυρό και ευέλικτο εργαλείο για την εκτέλεση λειτουργιών OCR σε διάφορους τύπους εγγράφων. Με την υποστήριξή του για πολλές γλώσσες, αρχεία εικόνας και PDF, χειρόγραφο κείμενο και ομαδική επεξεργασία, μπορείτε να εξαγάγετε κείμενο από τα έγγραφά σας γρήγορα και με ακρίβεια.

Εκτελέστε OCR σε πολλά αρχεία μέσω Java Library

String s = ocr.recognize("test.png;test2.jpg", -1, 0, 0, 400, 200,
   Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

perform OCR on a PDF input file:
String s = ocr.recognize("test.pdf", -1, 100, 100, 400, 200,
   Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

Υποστήριξη πολλαπλών νημάτων με χρήση Asprise OCR

Το Asprise OCR SDK για το Java API έχει συμπεριλάβει πλήρη υποστήριξη για multi-threading, η οποία επιτρέπει στους προγραμματιστές να επεξεργάζονται πολλές εργασίες OCR ταυτόχρονα. Αυτή η δυνατότητα επιτρέπει στους προγραμματιστές να βελτιώσουν την απόδοση των εφαρμογών τους OCR κατανέμοντας την επεξεργασία OCR σε πολλά νήματα, τα οποία μπορούν να εκτελούνται ταυτόχρονα σε πολλούς πυρήνες ή επεξεργαστές. Η υποστήριξη πολλαπλών νημάτων είναι εξαιρετικά προσαρμόσιμη, επιτρέποντας στους προγραμματιστές να προσαρμόσουν με ακρίβεια τον αριθμό των νημάτων και των μηχανών OCR ώστε να ταιριάζει με τους διαθέσιμους πόρους και τις απαιτήσεις επεξεργασίας. Σε μεγάλο βαθμό, η υποστήριξη πολλαπλών νημάτων του Asprise OCR SDK for Java παρέχει στους προγραμματιστές ένα ισχυρό και ευέλικτο εργαλείο για τη δημιουργία εφαρμογών OCR υψηλής απόδοσης που μπορούν να επεξεργαστούν μεγάλους όγκους κειμένου γρήγορα και αποτελεσματικά.

Γράψιμο κώδικα διαχείρισης δύσκολου νήματος

OcrExecutorService oes =
  new OcrExecutorService("eng", Ocr.SPEED_FASTEST, 4); // 4 threads

List> futures = oes.invokeAll(Arrays.asList(
  new OcrExecutorService.OcrCallable(
    new File[] {new File("test1.png")},
      Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML),
  new OcrExecutorService.OcrCallable(
    new File[] {new File("test2.png")},
      Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML)
);

System.out.println("Result of test1.png: " + futures.get(0).get());
System.out.println("Result of test2.png: " + futures.get(1).get());

oes.shutdown(); // stops all OCR engines and disposes all threads
 Ελληνικά