1. 製品
  2.   OCR
  3.   JavaScript
  4.   Baidu-ocr-api
 
  

Free Node.js API to Recognize & Extract Text from Images

A Free Node.js is a Leading Node.js API that Offers High Accuracy in Text Recognition Across Multiple Languages and a Variety of Fonts and Layouts.

今日の AI 主導の開発世界では、光学文字認識(OCR)は画像やドキュメントからテキストを自動抽出するために不可欠となっています。Node.js で OCR を作成しようとする開発者は、画像からのテキスト抽出、手書き文字認識、さらには Node.js アプリ内でのフォーム認識といった高度なタスクをサポートする強力なツールである Baidu-OCR-API を大いに活用できます。請求書のスキャン、ドキュメントのデジタル化、アクセシビリティ機能の有効化など、あらゆる用途において、この Node.js OCR ライブラリは高性能で、最新のアプリケーションに簡単に統合できます。

Baidu-OCR-API は、深層学習を活用して印刷文字と手書き文字を複数の言語(中国語、英語、日本語など)で認識する無料の Node.js OCR API です。Node.js におけるテーブル認識、ビジネス文書のスキャン、低照度や歪んだ画像といった複雑な条件下でのテキスト認識に優れています。開発者は自然シーン内のテキストも認識できるため、モバイルアプリ、拡張現実、リアルタイム翻訳のユースケースに最適です。正確な認識と多様な活用例により、Baidu-OCR-API は Node.js アプリケーションに信頼性の高い OCR 機能を統合したいすべての開発者にとって理想的な選択です。

Previous Next

Baidu-OCR-API の開始方法

Baidu-OCR-API をインストールする推奨方法は npm を使用することです。スムーズなインストールのために以下のコマンドをご利用ください。

npm で Baidu-OCR-API をインストール

 npm install baidu-ocr-api -g 

手動でインストールすることも可能です。最新のリリースファイルを GitHub リポジトリから直接ダウンロードしてください。

Node.js アプリ内で画像からテキストを抽出

Baidu-OCR-API は、ソフトウェア開発者が画像を読み込み、Node.js アプリケーション内でテキストを抽出することを容易にします。一般的なテキスト認識機能により、画像から印刷されたテキストを読み込んで抽出でき、さまざまなドキュメントに対応します。API は JPEG、PNG、GIF、TIFF、PDF、BMP などの一般的な画像ファイル形式をサポートしています。以下の例は、Node.js アプリケーション内で画像を読み込みテキスト認識を実行する方法を示しています。

Node.js アプリ内で画像を読み込みテキスト認識を実行する方法は?

//Read image

const fs = require('fs');

// Read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

const image = readImage('path_to_your_image.jpg');

// Perform OCR
client.generalBasic(image).then(result => {
    console.log('Recognized Text:');
    result.words_result.forEach(wordInfo => {
        console.log(wordInfo.words);
    });
}).catch(err => {
    console.error(err);
});

Node.js アプリ内でのフォームおよびテーブル認識

オープンソースの Baidu-OCR-API は、Node.js アプリケーション内でフォームやテーブルを認識する完全な機能を提供しています。タスクを成功させるには、まず API クレデンシャルを使用して Baidu OCR クライアントを設定する必要があります。その後、画像を読み込みフォームおよびテーブル認識を実行するコードを書きます。この機能は、構造化されたドキュメントからのデータ抽出を自動化し、さまざまなアプリケーションの生産性を向上させるのに特に有用です。以下は、Node.js 環境で画像を読み込みフォームとテーブル認識を実行する簡単な例です。

Node.js アプリで画像を読み込みフォームとテーブル認識を実行する方法は?

const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');

// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';

// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);

// Function to read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Form and Table Recognition
client.form(image).then(result => {
    console.log('Form and Table Data:');
    console.log(JSON.stringify(result, null, 2));
}).catch(err => {
    console.error('Error:', err);
});

Node.js API を使用した手書きテキスト認識

オープンソースの Baidu-OCR-API は扱いやすく、Node.js アプリケーション内で手書きテキストを高精度に認識することができます。目的を達成するために、画像ファイルを読み込み Base64 文字列に変換し、その後 Handwriting メソッドを Base64 エンコードされた画像で呼び出すと、認識された手書きテキストがコンソールに出力されます。以下の例は、Node.js でオープンソースの Baidu OCR API を使用して手書きテキスト認識を実行する方法を示しています。

Node.js アプリで手書きテキスト認識を実行する方法は?

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
    console.log('Recognized Handwritten Text:');
    result.words_result.forEach(wordInfo => {
        console.log(word
 日本