Δωρεάν API Node.js για Προσθήκη Δυνατοτήτων OCR σε Έργα JS.

Βιβλιοθήκη OCR Node.js Ανοιχτού Κώδικα που Επιτρέπει στους Προγραμματιστές να Αναγνωρίζουν & Εξάγουν Κείμενο από Διάφορες Μορφές Αρχείων, συμπεριλαμβανομένων Εικόνων (JPEG, PNG), PDF και Εγγράφων, Δωρεάν σε Πολλές Γλώσσες.

Τι είναι το Node-Tesseract-OCR;

Στη σημερινή ψηφιακή εποχή, η εξαγωγή κειμένου από εικόνες και έγγραφα έχει γίνει κρίσιμη εργασία σε διάφορους κλάδους, όπως η διαχείριση εγγράφων, η επεξεργασία δεδομένων και η τεχνητή νοημοσύνη. Η τεχνολογία Optical Character Recognition (OCR) έχει καταστήσει δυνατή τη μετατροπή σαρωμένων εγγράφων, εικόνων και PDF σε επεξεργάσιμες μορφές κειμένου. Το Node-Tesseract-OCR είναι ένα API ανοιχτού κώδικα που ενσωματώνει τη δύναμη της μηχανής OCR Tesseract για να παρέχει έναν απρόσκοπτο και αποδοτικό τρόπο εκτέλεσης εργασιών OCR σε εφαρμογές Node.js.

Το Node-Tesseract-OCR είναι ένα wrapper Node.js για τη μηχανή OCR Tesseract, επιτρέποντας στους προγραμματιστές λογισμικού να αξιοποιούν τις ισχυρές δυνατότητες αναγνώρισης κειμένου του Tesseract σε περιβάλλον Node.js. Το API συντηρείται σε αυτό το αποθετήριο GitHub και προσφέρει ένα σύνολο λειτουργιών που το καθιστούν κατάλληλο για διάφορες περιπτώσεις χρήσης, από απλή εξαγωγή κειμένου μέχρι πιο σύνθετες εργασίες επεξεργασίας εγγράφων. Οι προγραμματιστές μπορούν να εξάγουν κείμενο από εικόνες και έγγραφα σε πολλές γλώσσες, καθιστώντας το ένα ευέλικτο εργαλείο για διάφορες εφαρμογές.

Το API Node-Tesseract-OCR παρέχει προχωρημένες δυνατότητες επεξεργασίας εικόνας, όπως φιλτράρισμα, αλλαγή μεγέθους και περικοπή, ώστε το εξαγόμενο κείμενο να είναι ακριβές και αξιόπιστο. Υποστηρίζει πάνω από 100 γλώσσες, καθιστώντας το μια ευέλικτη λύση για εργασίες OCR σε διαφορετικά περιβάλλοντα. Οι προγραμματιστές μπορούν να εξάγουν κείμενο από εικόνες, PDF και έγγραφα και να επιστρέφουν το κείμενο σε διάφορες μορφές, όπως JSON, XML και απλό κείμενο. Έχει σχεδιαστεί ώστε να είναι ελαφρύ, ευέλικτο και εύκολο στη χρήση, καθιστώντας το ιδανική επιλογή για προγραμματιστές που θέλουν να προσθέσουν δυνατότητες OCR στα έργα τους. Με τις προχωρημένες δυνατότητες επεξεργασίας εικόνας, την υποστήριξη γλωσσών και τους μηχανισμούς διαχείρισης σφαλμάτων, αποτελεί ιδανική επιλογή για προγραμματιστές που επιθυμούν να ενσωματώσουν OCR.

Επισκόπηση

Μια επισκόπηση των χαρακτηριστικών του Node-Tesseract-OCR.

Features Overview

Εκτέλεση OCR
Προσθήκη Δυνατοτήτων OCR
Αναγνώριση κειμένου εικόνας
Μετατροπή εικόνων κειμένου
Αναγνωρισμένο κείμενο γραμματοσειράς
Αναζήτηση PDF
Πάνω από 100 Γλώσσες
Δημιουργία εφαρμογών OCR
Αποθήκευση στον περιηγητή
Εξαγωγή Κειμένου
Υποστήριξη πολυνηματικότητας

Node-Tesseract-OCR

Το Node-Tesseract-OCR υποστηρίζει δημοφιλείς μορφές αρχείων εικόνας όπως φαίνεται παρακάτω.

Αναγνώστης

PNG, JPEG, BMP, TIFF, TGA, DICOM

Συγγραφέας

PNG, JPEG, BMP, TIFF

Node-Tesseract-OCR

Ανεξαρτησία Πλατφόρμας

Το Node-Tesseract-OCR μπορεί να λειτουργήσει με οποιαδήποτε γλώσσα προγραμματισμού βασισμένη στην Java

Java

Node-Tesseract-OCR

Ξεκινώντας με το Node-Tesseract-OCR

Ο συνιστώμενος τρόπος εγκατάστασης του Node-Tesseract-OCR είναι μέσω npm. Παρακαλώ χρησιμοποιήστε την παρακάτω εντολή για ομαλή εγκατάσταση

Εγκατάσταση Node-Tesseract-OCR μέσω npm

npm install node-tesseract-ocr

Μπορείτε επίσης να το εγκαταστήσετε χειροκίνητα· κατεβάστε τα τελευταία αρχεία έκδοσης απευθείας από το αποθετήριο GitHub .

Εξαγωγή Κειμένου από Εικόνες στο API Node.js

Η βιβλιοθήκη ανοιχτού κώδικα Node-Tesseract-OCR καθιστά εύκολη τη δημιουργία εφαρμογών που εξάγουν αυτόματα κείμενο από εικόνες μέσα σε εφαρμογές Node.js. Υποστηρίζει την εξαγωγή κειμένου από σαρωμένα έγγραφα, PDF, φωτογραφίες κάμερας ή φωτογραφίες αποδείξεων. Αυτό μπορεί να είναι χρήσιμο για τη δημιουργία αναζητήσιμων αρχείων, την αυτοματοποίηση εισαγωγής δεδομένων ή την επεξεργασία μεγάλου όγκου εγγράφων σε τομείς όπως η χρηματοοικονομική και η υγειονομική περίθαλψη. Ακολουθεί ένα απλό παράδειγμα που δείχνει πώς να εξάγετε προγραμματιστικά κείμενο από εικόνες σε εφαρμογές Node.js.

Πώς να εξάγετε κείμενο από εικόνες σε περιβάλλον Node.js;

const tesseract = require("node-tesseract-ocr");

tesseract.recognize("path/to/image.jpg")
  .then(text => {
    console.log("Recognized Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Καλύτερη Προεπεξεργασία Εικόνας στο Node.js

Η προεπεξεργασία εικόνων πριν την εφαρμογή OCR μπορεί να βελτιώσει σημαντικά την ακρίβεια της αναγνώρισης κειμένου. Η βιβλιοθήκη ανοιχτού κώδικα Node-Tesseract-OCR επιτρέπει βασικές τεχνικές προεπεξεργασίας, όπως αλλαγή μεγέθους, δυαδικοποίηση και διόρθωση κλίσης. Αυτά τα βήματα μπορούν να υλοποιηθούν με πρόσθετες βιβλιοθήκες Node.js όπως το sharp ή το jimp σε συνδυασμό με το Node-Tesseract-OCR. Το παρακάτω παράδειγμα δείχνει πώς οι προγραμματιστές χρησιμοποιούν βήματα προεπεξεργασίας για να βελτιώσουν την αναγνώριση, ειδικά σε εικόνες χαμηλής ποιότητας.

Πώς να εφαρμόσετε βήματα προεπεξεργασίας για βελτίωση της αναγνώρισης μέσω API Node.js;

const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");

sharp("path/to/input.jpg")
  .resize(800, 600) // Resize the image
  .greyscale() // Convert to greyscale
  .toBuffer()
  .then(data => {
    return tesseract.recognize(data, { lang: "eng" });
  })
  .then(text => {
    console.log("Preprocessed Image Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Αναγνωρισμένο Κείμενο σε Πολλές Γλώσσες

Ένα από τα πιο αξιοσημείωτα χαρακτηριστικά του Node-Tesseract-OCR είναι η εκτενής υποστήριξη πολλαπλών γλωσσών. Η βιβλιοθήκη OCR Tesseract υποστηρίζει πάνω από 100 γλώσσες, καθιστώντας την ιδανική επιλογή για εφαρμογές που χρειάζονται επεξεργασία εγγράφων σε διάφορες γλώσσες. Οι προγραμματιστές μπορούν να καθορίσουν τη(ς) γλώσσα(ες) που θέλουν να χρησιμοποιήσει το Tesseract, βελτιώνοντας την ακρίβεια αναγνώρισης για μη‑αγγλικά κείμενα. Ακολουθεί ένα παράδειγμα που δείχνει πώς οι προγραμματιστές μπορούν να αναγνωρίσουν κείμενο στα γαλλικά σε εφαρμογές Node.js;

Πώς να αναγνωρίσετε κείμενο από εικόνα στα γαλλικά μέσω JavaScript API;

const config = {
  lang: "fra", // French language support
  oem: 1,
  psm: 3
};

tesseract.recognize("path/to/french-text-image.jpg", config)
  .then(text => {
    console.log("Recognized Text in French:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });