Darmowe API Node.js do rozpoznawania i wyodrębniania tekstu z obrazów
Darmowe Node.js to wiodące API Node.js, które oferuje wysoką dokładność rozpoznawania tekstu w wielu językach oraz różnorodne czcionki i układy.
W dzisiejszym świecie rozwoju napędzanego sztuczną inteligencją, rozpoznawanie znaków optycznych (OCR) stało się niezbędne do automatyzacji wyodrębniania tekstu z obrazów i dokumentów. Programiści, którzy chcą tworzyć OCR w Node.js, mogą w dużym stopniu skorzystać z Baidu-OCR-API – potężnego narzędzia obsługującego wyodrębnianie tekstu z obrazów, rozpoznawanie odręcznego tekstu oraz zaawansowane zadania, takie jak rozpoznawanie formularzy w aplikacjach Node.js. Niezależnie od tego, czy chodzi o skanowanie faktur, digitalizację dokumentów czy udostępnianie funkcji dostępności, ta biblioteka OCR Node.js zapewnia wysoką wydajność i łatwość integracji z nowoczesnymi aplikacjami.
Baidu-OCR-API to darmowe API OCR Node.js, które wykorzystuje uczenie głębokie do rozpoznawania druku i ręcznego pisma w wielu językach, w tym chińskim, angielskim, japońskim i innych. Doskonale radzi sobie z rozpoznawaniem tabel w Node.js, skanowaniem dokumentów biznesowych oraz rozpoznawaniem tekstu w trudnych warunkach, takich jak słabe oświetlenie czy zniekształcone obrazy. Programiści mogą także rozpoznawać tekst w naturalnych scenach, co czyni je idealnym rozwiązaniem dla aplikacji mobilnych, rzeczywistości rozszerzonej i tłumaczeń w czasie rzeczywistym. Dzięki precyzyjnemu rozpoznawaniu i wszechstronnym zastosowaniom Baidu-OCR-API jest doskonałym wyborem dla każdego dewelopera, który chce zintegrować niezawodną funkcję OCR w aplikacjach Node.js.
Rozpoczęcie pracy z Baidu-OCR-API
Zalecany sposób instalacji Baidu-OCR-API to użycie npm. Proszę użyć poniższego polecenia, aby uzyskać płynną instalację
Zainstaluj Baidu-OCR-API za pomocą npm
npm install baidu-ocr-api -g Możesz również zainstalować go ręcznie; pobierz najnowsze pliki wydania bezpośrednio z GitHub repozytorium.
Wyodrębnianie tekstu z obrazów w aplikacjach Node.js
Baidu-OCR-API ułatwia programistom ładowanie i odczytywanie obrazów oraz wyodrębnianie tekstu w aplikacjach Node.js. Funkcja ogólnego rozpoznawania tekstu pozwala programistom ładować i wyodrębniać drukowany tekst z obrazów, co jest przydatne w szerokim zakresie dokumentów. API obsługuje różne popularne formaty plików graficznych, takie jak JPEG, PNG, GIF, TIFF, PDF, BMP i wiele innych. Poniższy przykład pokazuje, jak programiści mogą załadować obraz i wykonać rozpoznawanie tekstu w aplikacjach Node.js.
Jak załadować i wykonać rozpoznawanie tekstu na obrazie w aplikacjach Node.js?
//Read image
const fs = require('fs');
// Read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
const image = readImage('path_to_your_image.jpg');
// Perform OCR
client.generalBasic(image).then(result => {
console.log('Recognized Text:');
result.words_result.forEach(wordInfo => {
console.log(wordInfo.words);
});
}).catch(err => {
console.error(err);
});
Rozpoznawanie formularzy i tabel w aplikacjach Node.js
Open‑source Baidu-OCR-API zapewnia pełną funkcjonalność rozpoznawania formularzy i tabel w aplikacjach Node.js. Aby wykonać to zadanie, najpierw należy skonfigurować klienta Baidu OCR przy użyciu danych uwierzytelniających API. Następnie napisz kod, który odczyta obraz i wykona rozpoznawanie formularzy oraz tabel. Funkcjonalność ta jest szczególnie przydatna do automatyzacji wyodrębniania danych ze strukturalnych dokumentów i zwiększania wydajności w różnych aplikacjach. Poniżej znajduje się prosty przykład, który pokazuje, jak programista może odczytać obraz i wykonać rozpoznawanie formularzy oraz tabel w środowisku Node.js.
Jak odczytać obraz i wykonać rozpoznawanie formularzy oraz tabel w aplikacjach Node.js?
const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');
// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';
// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);
// Function to read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Form and Table Recognition
client.form(image).then(result => {
console.log('Form and Table Data:');
console.log(JSON.stringify(result, null, 2));
}).catch(err => {
console.error('Error:', err);
});
Rozpoznawanie odręcznego tekstu za pomocą API Node.js
Open‑source Baidu-OCR-API jest bardzo łatwy w obsłudze i w pełni zdolny do rozpoznawania odręcznego tekstu z wysoką precyzją w aplikacjach Node.js. Aby osiągnąć cel, plik obrazu jest odczytywany i konwertowany na ciąg base64, a następnie wywoływana jest metoda handwriting z zakodowanym obrazem, a rozpoznany odręczny tekst jest wypisywany w konsoli. Poniższy przykład demonstruje, jak programiści mogą wykonać rozpoznawanie odręcznego tekstu przy użyciu open‑source Baidu OCR API w Node.js.
Jak wykonać rozpoznawanie odręcznego tekstu w aplikacjach Node.js?
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
console.log('Recognized Handwritten Text:');
result.words_result.forEach(wordInfo => {
console.log(word