Darmowe API Node.js umożliwiające dodanie funkcji OCR do projektów JS.

Otwarta biblioteka OCR Node.js, która pozwala programistom rozpoznawać i wyodrębniać tekst z różnych formatów plików, w tym obrazów (JPEG, PNG), PDF‑ów i dokumentów, za darmo w wielu językach.

Co to jest Node-Tesseract-OCR?

W dzisiejszej erze cyfrowej wyodrębnianie tekstu z obrazów i dokumentów stało się kluczowym zadaniem w różnych branżach, w tym w zarządzaniu dokumentami, przetwarzaniu danych i sztucznej inteligencji. Technologia rozpoznawania znaków optycznych (OCR) umożliwia konwersję zeskanowanych dokumentów, obrazów i plików PDF do edytowalnych formatów tekstowych. Node-Tesseract-OCR to otwartoźródłowe API, które wykorzystuje moc silnika Tesseract OCR, zapewniając płynny i wydajny sposób wykonywania zadań OCR w aplikacjach Node.js.

Node-Tesseract-OCR jest wrapperem Node.js dla silnika Tesseract OCR, pozwalając programistom wykorzystać potężne funkcje rozpoznawania tekstu Tesseract w środowisku Node.js. API jest utrzymywane w tym repozytorium GitHub i oferuje szereg funkcjonalności, które czynią je odpowiednim dla różnych zastosowań, od prostego wyodrębniania tekstu po bardziej złożone zadania przetwarzania dokumentów. Programiści mogą wyodrębniać tekst z obrazów i dokumentów w wielu językach, co czyni je wszechstronnym narzędziem dla różnych aplikacji.

API Node-Tesseract-OCR zapewnia zaawansowane możliwości przetwarzania obrazu, w tym filtrowanie, zmianę rozmiaru i przycinanie, aby zapewnić dokładność i niezawodność wyodrębnionego tekstu. Obsługuje ponad 100 języków, co czyni je wszechstronnym rozwiązaniem dla zadań OCR w różnorodnych środowiskach. Programiści mogą wyodrębniać tekst z obrazów, PDF‑ów i dokumentów oraz zwracać go w różnych formatach, takich jak JSON, XML i zwykły tekst. Jest zaprojektowane tak, aby było lekkie, elastyczne i łatwe w użyciu, co czyni je idealnym wyborem dla deweloperów chcących dodać funkcje OCR do swoich projektów. Dzięki zaawansowanym możliwościom przetwarzania obrazu, wsparciu językowemu i mechanizmom obsługi błędów, jest to doskonały wybór dla deweloperów, którzy chcą wzbogacić swoje projekty o OCR.

Na pierwszy rzut oka

Przegląd funkcji Node-Tesseract-OCR.

Przegląd funkcji

Wykonywanie OCR
Dodawanie funkcji OCR
Rozpoznawanie tekstu na obrazie
Konwertowanie obrazów z tekstem
Rozpoznawanie czcionek
Przeszukiwanie PDF
Ponad 100 języków
Tworzenie aplikacji OCR
Zapisywanie w przeglądarce
Wyodrębnianie tekstu
Wsparcie wielowątkowości

Node-Tesseract-OCR

Node-Tesseract-OCR obsługuje popularne formaty plików graficznych wymienione poniżej.

Czytnik

PNG, JPEG, BMP, TIFF, TGA, DICOM

Zapis

PNG, JPEG, BMP, TIFF

Node-Tesseract-OCR

Niezależność platformowa

Node-Tesseract-OCR może współpracować z dowolnym językiem programowania opartym na Javie

Java

Node-Tesseract-OCR

Rozpoczęcie pracy z Node-Tesseract-OCR

Zalecany sposób instalacji Node-Tesseract-OCR to użycie npm. Proszę użyć poniższego polecenia, aby przeprowadzić płynną instalację

Instalacja Node-Tesseract-OCR przez npm

npm install node-tesseract-ocr

Możesz również zainstalować go ręcznie; pobierz najnowsze pliki wydania bezpośrednio z repozytorium GitHub.

Wyodrębnianie tekstu z obrazów w API Node.js

Otwarta biblioteka Node-Tesseract-OCR ułatwia programistom tworzenie aplikacji, które automatycznie wyodrębniają tekst z obrazów w aplikacjach Node.js. Obsługuje wyodrębnianie tekstu ze skanowanych dokumentów, PDF‑ów, zdjęć z aparatu lub zdjęć paragonów. Może to być przydatne przy tworzeniu przeszukiwalnych archiwów, automatyzacji wprowadzania danych lub przetwarzaniu dużych ilości dokumentów w sektorach takich jak finanse i opieka zdrowotna. Poniżej znajduje się prosty przykład, który pokazuje, jak programowo wyodrębnić tekst z obrazów w aplikacjach Node.js.

Jak wyodrębnić tekst z obrazów w środowisku Node.js?

const tesseract = require("node-tesseract-ocr");

tesseract.recognize("path/to/image.jpg")
  .then(text => {
    console.log("Recognized Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Lepsze przetwarzanie wstępne obrazów w Node.js

Przetwarzanie wstępne obrazów przed zastosowaniem OCR może znacząco poprawić dokładność rozpoznawania tekstu. Otwarta biblioteka Node-Tesseract-OCR umożliwia podstawowe techniki przetwarzania wstępnego, takie jak zmiana rozmiaru, binaryzacja i prostowanie. Kroki te można zaimplementować przy użyciu dodatkowych bibliotek Node.js, takich jak sharp lub jimp, w połączeniu z Node-Tesseract-OCR. Poniższy przykład pokazuje, jak programiści wykorzystują kroki przetwarzania wstępnego, aby poprawić rozpoznawanie, szczególnie w przypadku obrazów o niższej jakości.

Jak zastosować kroki przetwarzania wstępnego, aby poprawić rozpoznawanie za pomocą API Node.js?

const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");

sharp("path/to/input.jpg")
  .resize(800, 600) // Resize the image
  .greyscale() // Convert to greyscale
  .toBuffer()
  .then(data => {
    return tesseract.recognize(data, { lang: "eng" });
  })
  .then(text => {
    console.log("Preprocessed Image Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Rozpoznany tekst w wielu językach

Jedną z wyróżniających się cech Node-Tesseract-OCR jest rozległe wsparcie wielojęzyczne. Biblioteka OCR Tesseract obsługuje ponad 100 języków, co czyni ją idealnym wyborem dla aplikacji, które muszą przetwarzać dokumenty w różnych językach. Programiści mogą określić język(i), które mają być użyte przez Tesseract, zwiększając dokładność rozpoznawania tekstu nieangielskiego. Poniżej znajduje się przykład, który pokazuje, jak programiści mogą rozpoznać tekst w języku francuskim w aplikacjach Node.js?

Jak rozpoznać tekst z obrazu w języku francuskim za pomocą API JavaScript?

const config = {
  lang: "fra", // French language support
  oem: 1,
  psm: 3
};

tesseract.recognize("path/to/french-text-image.jpg", config)
  .then(text => {
    console.log("Recognized Text in French:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });