Darmowe API Node.js do rozpoznawania i wyodrębniania tekstu z obrazów
Darmowe Node.js to wiodące API Node.js, które oferuje wysoką dokładność rozpoznawania tekstu w wielu językach oraz różnorodne czcionki i układy.
W dzisiejszym świecie rozwoju napędzanego sztuczną inteligencją, rozpoznawanie znaków optycznych (OCR) stało się niezbędne do automatyzacji wyodrębniania tekstu z obrazów i dokumentów. Programiści, którzy chcą tworzyć OCR w Node.js, mogą znacznie skorzystać z Baidu-OCR-API, potężnego narzędzia wspierającego wyodrębnianie tekstu z obrazów, rozpoznawanie odręcznego tekstu oraz nawet zaawansowane zadania, takie jak rozpoznawanie formularzy w aplikacjach Node.js. Niezależnie od tego, czy chodzi o skanowanie faktur, digitalizację dokumentów czy udostępnianie funkcji dostępności, ta biblioteka OCR Node.js oferuje wysoką wydajność i jest łatwa do integracji z nowoczesnymi aplikacjami.
Baidu-OCR-API to darmowe API OCR Node.js, które wykorzystuje uczenie głębokie do rozpoznawania drukowanego i odręcznego tekstu w wielu językach, w tym chińskim, angielskim, japońskim i innych. Doskonale radzi sobie z rozpoznawaniem tabel w Node.js, skanowaniem dokumentów biznesowych oraz rozpoznawaniem tekstu w trudnych warunkach, takich jak słabe oświetlenie czy zniekształcone obrazy. Programiści mogą także rozpoznawać tekst w naturalnych scenach, co czyni je idealnym rozwiązaniem dla aplikacji mobilnych, rzeczywistości rozszerzonej i przypadków użycia wymagających tłumaczenia w czasie rzeczywistym. Dzięki precyzyjnemu rozpoznawaniu i wszechstronnym zastosowaniom, Baidu-OCR-API jest doskonałym wyborem dla każdego programisty, który chce zintegrować niezawodną funkcję OCR w aplikacjach Node.js.
Rozpoczęcie pracy z Baidu-OCR-API
Zalecany sposób instalacji Baidu-OCR-API to użycie npm. Proszę użyć następującego polecenia, aby uzyskać płynną instalację
Zainstaluj Baidu-OCR-API za pomocą npm
npm install baidu-ocr-api -g Możesz również zainstalować go ręcznie; pobierz najnowsze pliki wydania bezpośrednio z repozytorium GitHub.
Wyodrębnianie tekstu z obrazów w aplikacjach Node.js
Baidu-OCR-API ułatwia programistom ładowanie i odczytywanie obrazów oraz wyodrębnianie tekstu w aplikacjach Node.js. Funkcja ogólnego rozpoznawania tekstu pozwala programistom ładować i wyodrębniać drukowany tekst z obrazów, odpowiedni dla szerokiego zakresu dokumentów. API zawiera wsparcie dla różnych popularnych formatów plików graficznych, takich jak JPEG, PNG, GIF, TIFF, PDF, BMP i wiele innych. Poniższy przykład pokazuje, jak programiści mogą ładować i wykonywać rozpoznawanie tekstu na obrazie w aplikacjach Node.js.
Jak ładować i wykonywać rozpoznawanie tekstu na obrazie w aplikacjach Node.js?
//Read image
const fs = require('fs');
// Read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
const image = readImage('path_to_your_image.jpg');
// Perform OCR
client.generalBasic(image).then(result => {
console.log('Recognized Text:');
result.words_result.forEach(wordInfo => {
console.log(wordInfo.words);
});
}).catch(err => {
console.error(err);
});
Rozpoznawanie formularzy i tabel w aplikacjach Node.js
Open source Baidu-OCR-API zapewnia pełną funkcjonalność rozpoznawania formularzy i tabel w aplikacjach Node.js. Aby pomyślnie wykonać zadanie, najpierw należy skonfigurować klienta Baidu OCR przy użyciu danych uwierzytelniających API. Następnie napisać kod do odczytu obrazu i wykonania rozpoznawania formularzy i tabel. Ta funkcjonalność może być szczególnie przydatna do automatyzacji wyodrębniania danych ze strukturalnych dokumentów i zwiększania wydajności w różnych aplikacjach. Poniżej prosty przykład, który pokazuje, jak programista może odczytać obraz i wykonać rozpoznawanie formularzy i tabel w środowisku Node.js.
Jak odczytać obraz i wykonać rozpoznawanie formularzy i tabel w aplikacjach Node.js?
const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');
// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';
// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);
// Function to read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Form and Table Recognition
client.form(image).then(result => {
console.log('Form and Table Data:');
console.log(JSON.stringify(result, null, 2));
}).catch(err => {
console.error('Error:', err);
});
Rozpoznawanie odręcznego tekstu za pomocą API Node.js
Open source Baidu-OCR-API jest bardzo łatwy w obsłudze i w pełni zdolny do rozpoznawania odręcznego tekstu z wysoką precyzją w aplikacjach Node.js. Aby osiągnąć cel, plik obrazu jest odczytywany i konwertowany na ciąg base64, a następnie wywoływana jest metoda handwriting z zakodowanym w base64 obrazem, a rozpoznany odręczny tekst jest logowany w konsoli. Poniższy przykład demonstruje, jak programiści mogą wykonać rozpoznawanie odręcznego tekstu przy użyciu otwartoźródłowego Baidu OCR API w Node.js.
Jak wykonać rozpoznawanie odręcznego tekstu w aplikacjach Node.js?
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
console.log('Recognized Handwritten Text:');
result.words_result.forEach(wordInfo => {
console.log(word