Darmowe API Node.js do rozpoznawania i wyodrębniania tekstu z obrazów

Darmowe Node.js to wiodące API Node.js, które oferuje wysoką dokładność rozpoznawania tekstu w wielu językach oraz różnorodne czcionki i układy.

W dzisiejszym świecie rozwoju napędzanego sztuczną inteligencją, rozpoznawanie znaków optycznych (OCR) stało się niezbędne do automatyzacji wyodrębniania tekstu z obrazów i dokumentów. Programiści, którzy chcą tworzyć OCR w Node.js, mogą w dużym stopniu skorzystać z Baidu-OCR-API – potężnego narzędzia obsługującego wyodrębnianie tekstu z obrazów, rozpoznawanie odręcznego tekstu oraz zaawansowane zadania, takie jak rozpoznawanie formularzy w aplikacjach Node.js. Niezależnie od tego, czy chodzi o skanowanie faktur, digitalizację dokumentów czy udostępnianie funkcji dostępności, ta biblioteka OCR Node.js zapewnia wysoką wydajność i łatwość integracji z nowoczesnymi aplikacjami.

Baidu-OCR-API to darmowe API OCR Node.js, które wykorzystuje uczenie głębokie do rozpoznawania druku i ręcznego pisma w wielu językach, w tym chińskim, angielskim, japońskim i innych. Doskonale radzi sobie z rozpoznawaniem tabel w Node.js, skanowaniem dokumentów biznesowych oraz rozpoznawaniem tekstu w trudnych warunkach, takich jak słabe oświetlenie czy zniekształcone obrazy. Programiści mogą także rozpoznawać tekst w naturalnych scenach, co czyni je idealnym rozwiązaniem dla aplikacji mobilnych, rzeczywistości rozszerzonej i tłumaczeń w czasie rzeczywistym. Dzięki precyzyjnemu rozpoznawaniu i wszechstronnym zastosowaniom Baidu-OCR-API jest doskonałym wyborem dla każdego dewelopera, który chce zintegrować niezawodną funkcję OCR w aplikacjach Node.js.

Na pierwszy rzut oka

Przegląd funkcji Baidu-OCR-API.

Przegląd funkcji

Wykonywanie OCR
Dodawanie możliwości OCR
Rozpoznawanie tekstu na obrazie
Konwertowanie obrazów z tekstem
Rozpoznawanie tekstu czcionki
Wyszukiwanie PDF
Ponad 100 języków
Tworzenie aplikacji OCR
Zapisywanie w przeglądarce
Wyodrębnianie tekstu
Obsługa wielowątkowości

Baidu-OCR-API

Baidu-OCR-API obsługuje popularne formaty plików graficznych wymienione poniżej.

Odczyt

PNG, JPEG, BMP, TIFF, TGA, DICOM

Zapis

PNG, JPEG, BMP, TIFF

Baidu-OCR-API

Niezależność platformowa

Baidu-OCR-API może współpracować z dowolnym językiem programowania opartym na Javie

Java

Baidu-OCR-API

Rozpoczęcie pracy z Baidu-OCR-API

Zalecany sposób instalacji Baidu-OCR-API to użycie npm. Proszę użyć poniższego polecenia, aby uzyskać płynną instalację

Zainstaluj Baidu-OCR-API za pomocą npm

 npm install baidu-ocr-api -g

Możesz również zainstalować go ręcznie; pobierz najnowsze pliki wydania bezpośrednio z GitHub repozytorium.

Wyodrębnianie tekstu z obrazów w aplikacjach Node.js

Baidu-OCR-API ułatwia programistom ładowanie i odczytywanie obrazów oraz wyodrębnianie tekstu w aplikacjach Node.js. Funkcja ogólnego rozpoznawania tekstu pozwala programistom ładować i wyodrębniać drukowany tekst z obrazów, co jest przydatne w szerokim zakresie dokumentów. API obsługuje różne popularne formaty plików graficznych, takie jak JPEG, PNG, GIF, TIFF, PDF, BMP i wiele innych. Poniższy przykład pokazuje, jak programiści mogą załadować obraz i wykonać rozpoznawanie tekstu w aplikacjach Node.js.

Jak załadować i wykonać rozpoznawanie tekstu na obrazie w aplikacjach Node.js?

//Read image

const fs = require('fs');

// Read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

const image = readImage('path_to_your_image.jpg');

// Perform OCR
client.generalBasic(image).then(result => {
    console.log('Recognized Text:');
    result.words_result.forEach(wordInfo => {
        console.log(wordInfo.words);
    });
}).catch(err => {
    console.error(err);
});

Rozpoznawanie formularzy i tabel w aplikacjach Node.js

Open‑source Baidu-OCR-API zapewnia pełną funkcjonalność rozpoznawania formularzy i tabel w aplikacjach Node.js. Aby wykonać to zadanie, najpierw należy skonfigurować klienta Baidu OCR przy użyciu danych uwierzytelniających API. Następnie napisz kod, który odczyta obraz i wykona rozpoznawanie formularzy oraz tabel. Funkcjonalność ta jest szczególnie przydatna do automatyzacji wyodrębniania danych ze strukturalnych dokumentów i zwiększania wydajności w różnych aplikacjach. Poniżej znajduje się prosty przykład, który pokazuje, jak programista może odczytać obraz i wykonać rozpoznawanie formularzy oraz tabel w środowisku Node.js.

Jak odczytać obraz i wykonać rozpoznawanie formularzy oraz tabel w aplikacjach Node.js?

const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');

// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';

// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);

// Function to read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Form and Table Recognition
client.form(image).then(result => {
    console.log('Form and Table Data:');
    console.log(JSON.stringify(result, null, 2));
}).catch(err => {
    console.error('Error:', err);
});

Rozpoznawanie odręcznego tekstu za pomocą API Node.js

Open‑source Baidu-OCR-API jest bardzo łatwy w obsłudze i w pełni zdolny do rozpoznawania odręcznego tekstu z wysoką precyzją w aplikacjach Node.js. Aby osiągnąć cel, plik obrazu jest odczytywany i konwertowany na ciąg base64, a następnie wywoływana jest metoda handwriting z zakodowanym obrazem, a rozpoznany odręczny tekst jest wypisywany w konsoli. Poniższy przykład demonstruje, jak programiści mogą wykonać rozpoznawanie odręcznego tekstu przy użyciu open‑source Baidu OCR API w Node.js.

Jak wykonać rozpoznawanie odręcznego tekstu w aplikacjach Node.js?

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
    console.log('Recognized Handwritten Text:');
    result.words_result.forEach(wordInfo => {
        console.log(word