Darmowe API Node.js do rozpoznawania i wyodrębniania tekstu z obrazów

Darmowe Node.js to wiodące API Node.js, które oferuje wysoką dokładność rozpoznawania tekstu w wielu językach oraz różnorodne czcionki i układy.

W dzisiejszym świecie rozwoju napędzanego sztuczną inteligencją, rozpoznawanie znaków optycznych (OCR) stało się niezbędne do automatyzacji wyodrębniania tekstu z obrazów i dokumentów. Programiści, którzy chcą tworzyć OCR w Node.js, mogą znacznie skorzystać z Baidu-OCR-API, potężnego narzędzia wspierającego wyodrębnianie tekstu z obrazów, rozpoznawanie odręcznego tekstu oraz nawet zaawansowane zadania, takie jak rozpoznawanie formularzy w aplikacjach Node.js. Niezależnie od tego, czy chodzi o skanowanie faktur, digitalizację dokumentów czy udostępnianie funkcji dostępności, ta biblioteka OCR Node.js oferuje wysoką wydajność i jest łatwa do integracji z nowoczesnymi aplikacjami.

Baidu-OCR-API to darmowe API OCR Node.js, które wykorzystuje uczenie głębokie do rozpoznawania drukowanego i odręcznego tekstu w wielu językach, w tym chińskim, angielskim, japońskim i innych. Doskonale radzi sobie z rozpoznawaniem tabel w Node.js, skanowaniem dokumentów biznesowych oraz rozpoznawaniem tekstu w trudnych warunkach, takich jak słabe oświetlenie czy zniekształcone obrazy. Programiści mogą także rozpoznawać tekst w naturalnych scenach, co czyni je idealnym rozwiązaniem dla aplikacji mobilnych, rzeczywistości rozszerzonej i przypadków użycia wymagających tłumaczenia w czasie rzeczywistym. Dzięki precyzyjnemu rozpoznawaniu i wszechstronnym zastosowaniom, Baidu-OCR-API jest doskonałym wyborem dla każdego programisty, który chce zintegrować niezawodną funkcję OCR w aplikacjach Node.js.

Na pierwszy rzut oka

Przegląd funkcji Baidu-OCR-API.

Przegląd funkcji

Wykonywanie OCR
Dodawanie możliwości OCR
Rozpoznawanie tekstu na obrazie
Konwertowanie obrazów tekstu
Rozpoznany tekst czcionki
Wyszukiwanie PDF
Ponad 100 języków
Tworzenie aplikacji OCR
Zapisywanie w przeglądarce
Wyodrębnianie tekstu
Wsparcie wielowątkowości

Baidu-OCR-API

Baidu-OCR-API obsługuje popularne formaty plików graficznych wymienione poniżej.

Czytnik

PNG, JPEG, BMP, TIFF, TGA, DICOM

Zapis

PNG, JPEG, BMP, TIFF

Baidu-OCR-API

Niezależność platformy

Baidu-OCR-API może działać z dowolnym językiem programowania opartym na Javie

Java

Baidu-OCR-API

Rozpoczęcie pracy z Baidu-OCR-API

Zalecany sposób instalacji Baidu-OCR-API to użycie npm. Proszę użyć następującego polecenia, aby uzyskać płynną instalację

Zainstaluj Baidu-OCR-API za pomocą npm

 npm install baidu-ocr-api -g

Możesz również zainstalować go ręcznie; pobierz najnowsze pliki wydania bezpośrednio z repozytorium GitHub.

Wyodrębnianie tekstu z obrazów w aplikacjach Node.js

Baidu-OCR-API ułatwia programistom ładowanie i odczytywanie obrazów oraz wyodrębnianie tekstu w aplikacjach Node.js. Funkcja ogólnego rozpoznawania tekstu pozwala programistom ładować i wyodrębniać drukowany tekst z obrazów, odpowiedni dla szerokiego zakresu dokumentów. API zawiera wsparcie dla różnych popularnych formatów plików graficznych, takich jak JPEG, PNG, GIF, TIFF, PDF, BMP i wiele innych. Poniższy przykład pokazuje, jak programiści mogą ładować i wykonywać rozpoznawanie tekstu na obrazie w aplikacjach Node.js.

Jak ładować i wykonywać rozpoznawanie tekstu na obrazie w aplikacjach Node.js?

//Read image

const fs = require('fs');

// Read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

const image = readImage('path_to_your_image.jpg');

// Perform OCR
client.generalBasic(image).then(result => {
    console.log('Recognized Text:');
    result.words_result.forEach(wordInfo => {
        console.log(wordInfo.words);
    });
}).catch(err => {
    console.error(err);
});

Rozpoznawanie formularzy i tabel w aplikacjach Node.js

Open source Baidu-OCR-API zapewnia pełną funkcjonalność rozpoznawania formularzy i tabel w aplikacjach Node.js. Aby pomyślnie wykonać zadanie, najpierw należy skonfigurować klienta Baidu OCR przy użyciu danych uwierzytelniających API. Następnie napisać kod do odczytu obrazu i wykonania rozpoznawania formularzy i tabel. Ta funkcjonalność może być szczególnie przydatna do automatyzacji wyodrębniania danych ze strukturalnych dokumentów i zwiększania wydajności w różnych aplikacjach. Poniżej prosty przykład, który pokazuje, jak programista może odczytać obraz i wykonać rozpoznawanie formularzy i tabel w środowisku Node.js.

Jak odczytać obraz i wykonać rozpoznawanie formularzy i tabel w aplikacjach Node.js?

const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');

// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';

// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);

// Function to read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Form and Table Recognition
client.form(image).then(result => {
    console.log('Form and Table Data:');
    console.log(JSON.stringify(result, null, 2));
}).catch(err => {
    console.error('Error:', err);
});

Rozpoznawanie odręcznego tekstu za pomocą API Node.js

Open source Baidu-OCR-API jest bardzo łatwy w obsłudze i w pełni zdolny do rozpoznawania odręcznego tekstu z wysoką precyzją w aplikacjach Node.js. Aby osiągnąć cel, plik obrazu jest odczytywany i konwertowany na ciąg base64, a następnie wywoływana jest metoda handwriting z zakodowanym w base64 obrazem, a rozpoznany odręczny tekst jest logowany w konsoli. Poniższy przykład demonstruje, jak programiści mogą wykonać rozpoznawanie odręcznego tekstu przy użyciu otwartoźródłowego Baidu OCR API w Node.js.

Jak wykonać rozpoznawanie odręcznego tekstu w aplikacjach Node.js?

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
    console.log('Recognized Handwritten Text:');
    result.words_result.forEach(wordInfo => {
        console.log(word