Darmowe API Node.js umożliwiające dodanie funkcji OCR do projektów JS.
Otwarta biblioteka OCR Node.js, która pozwala programistom rozpoznawać i wyodrębniać tekst z różnych formatów plików, w tym obrazów (JPEG, PNG), PDF‑ów i dokumentów, za darmo w wielu językach.
Co to jest Node-Tesseract-OCR?
W dzisiejszej erze cyfrowej wyodrębnianie tekstu z obrazów i dokumentów stało się kluczowym zadaniem w różnych branżach, w tym w zarządzaniu dokumentami, przetwarzaniu danych i sztucznej inteligencji. Technologia rozpoznawania znaków optycznych (OCR) umożliwia konwersję zeskanowanych dokumentów, obrazów i plików PDF do edytowalnych formatów tekstowych. Node-Tesseract-OCR to otwartoźródłowe API, które wykorzystuje moc silnika Tesseract OCR, zapewniając płynny i wydajny sposób wykonywania zadań OCR w aplikacjach Node.js.
Node-Tesseract-OCR jest wrapperem Node.js dla silnika Tesseract OCR, pozwalając programistom wykorzystać potężne funkcje rozpoznawania tekstu Tesseract w środowisku Node.js. API jest utrzymywane w tym repozytorium GitHub i oferuje szereg funkcjonalności, które czynią je odpowiednim dla różnych zastosowań, od prostego wyodrębniania tekstu po bardziej złożone zadania przetwarzania dokumentów. Programiści mogą wyodrębniać tekst z obrazów i dokumentów w wielu językach, co czyni je wszechstronnym narzędziem dla różnych aplikacji.
API Node-Tesseract-OCR zapewnia zaawansowane możliwości przetwarzania obrazu, w tym filtrowanie, zmianę rozmiaru i przycinanie, aby zapewnić dokładność i niezawodność wyodrębnionego tekstu. Obsługuje ponad 100 języków, co czyni je wszechstronnym rozwiązaniem dla zadań OCR w różnorodnych środowiskach. Programiści mogą wyodrębniać tekst z obrazów, PDF‑ów i dokumentów oraz zwracać go w różnych formatach, takich jak JSON, XML i zwykły tekst. Jest zaprojektowane tak, aby było lekkie, elastyczne i łatwe w użyciu, co czyni je idealnym wyborem dla deweloperów chcących dodać funkcje OCR do swoich projektów. Dzięki zaawansowanym możliwościom przetwarzania obrazu, wsparciu językowemu i mechanizmom obsługi błędów, jest to doskonały wybór dla deweloperów, którzy chcą wzbogacić swoje projekty o OCR.
Rozpoczęcie pracy z Node-Tesseract-OCR
Zalecany sposób instalacji Node-Tesseract-OCR to użycie npm. Proszę użyć poniższego polecenia, aby przeprowadzić płynną instalację
Instalacja Node-Tesseract-OCR przez npm
npm install node-tesseract-ocr Możesz również zainstalować go ręcznie; pobierz najnowsze pliki wydania bezpośrednio z repozytorium GitHub.
Wyodrębnianie tekstu z obrazów w API Node.js
Otwarta biblioteka Node-Tesseract-OCR ułatwia programistom tworzenie aplikacji, które automatycznie wyodrębniają tekst z obrazów w aplikacjach Node.js. Obsługuje wyodrębnianie tekstu ze skanowanych dokumentów, PDF‑ów, zdjęć z aparatu lub zdjęć paragonów. Może to być przydatne przy tworzeniu przeszukiwalnych archiwów, automatyzacji wprowadzania danych lub przetwarzaniu dużych ilości dokumentów w sektorach takich jak finanse i opieka zdrowotna. Poniżej znajduje się prosty przykład, który pokazuje, jak programowo wyodrębnić tekst z obrazów w aplikacjach Node.js.
Jak wyodrębnić tekst z obrazów w środowisku Node.js?
const tesseract = require("node-tesseract-ocr");
tesseract.recognize("path/to/image.jpg")
.then(text => {
console.log("Recognized Text:", text);
})
.catch(error => {
console.error("Error:", error.message);
});
Lepsze przetwarzanie wstępne obrazów w Node.js
Przetwarzanie wstępne obrazów przed zastosowaniem OCR może znacząco poprawić dokładność rozpoznawania tekstu. Otwarta biblioteka Node-Tesseract-OCR umożliwia podstawowe techniki przetwarzania wstępnego, takie jak zmiana rozmiaru, binaryzacja i prostowanie. Kroki te można zaimplementować przy użyciu dodatkowych bibliotek Node.js, takich jak sharp lub jimp, w połączeniu z Node-Tesseract-OCR. Poniższy przykład pokazuje, jak programiści wykorzystują kroki przetwarzania wstępnego, aby poprawić rozpoznawanie, szczególnie w przypadku obrazów o niższej jakości.
Jak zastosować kroki przetwarzania wstępnego, aby poprawić rozpoznawanie za pomocą API Node.js?
const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");
sharp("path/to/input.jpg")
.resize(800, 600) // Resize the image
.greyscale() // Convert to greyscale
.toBuffer()
.then(data => {
return tesseract.recognize(data, { lang: "eng" });
})
.then(text => {
console.log("Preprocessed Image Text:", text);
})
.catch(error => {
console.error("Error:", error.message);
});
Rozpoznany tekst w wielu językach
Jedną z wyróżniających się cech Node-Tesseract-OCR jest rozległe wsparcie wielojęzyczne. Biblioteka OCR Tesseract obsługuje ponad 100 języków, co czyni ją idealnym wyborem dla aplikacji, które muszą przetwarzać dokumenty w różnych językach. Programiści mogą określić język(i), które mają być użyte przez Tesseract, zwiększając dokładność rozpoznawania tekstu nieangielskiego. Poniżej znajduje się przykład, który pokazuje, jak programiści mogą rozpoznać tekst w języku francuskim w aplikacjach Node.js?
Jak rozpoznać tekst z obrazu w języku francuskim za pomocą API JavaScript?
const config = {
lang: "fra", // French language support
oem: 1,
psm: 3
};
tesseract.recognize("path/to/french-text-image.jpg", config)
.then(text => {
console.log("Recognized Text in French:", text);
})
.catch(error => {
console.error("Error:", error.message);
});