画像からテキストを認識・抽出する無料 Node.js API

無料の Node.js は、複数の言語とさまざまなフォント・レイアウトにわたるテキスト認識で高精度を提供するトップクラスの Node.js API です。

今日の AI 主導の開発世界において、光学文字認識（OCR）は画像や文書からテキストを自動抽出するために不可欠な技術となっています。Node.js で OCR を作成しようとする開発者は、画像からのテキスト抽出、手書き文字認識、さらにはフォーム認識といった高度なタスクをサポートする強力なツールである Baidu-OCR-API から大きな恩恵を受けられます。請求書のスキャン、文書のデジタル化、アクセシビリティ機能の実装など、さまざまなユースケースでこの Node.js OCR ライブラリは高いパフォーマンスを発揮し、モダンなアプリケーションへの統合も容易です。

Baidu-OCR-API は、深層学習を活用して印刷文字および手書き文字を多数の言語（中国語、英語、日本語など）で認識できる無料の Node.js OCR API です。テーブル認識やビジネス文書のスキャン、低照度や歪んだ画像といった複雑な条件下でも高い認識精度を発揮します。また、自然シーン内のテキスト認識も可能なため、モバイルアプリ、拡張現実、リアルタイム翻訳などのシナリオに最適です。正確な認識と多様な活用例を備えた Baidu-OCR-API は、Node.js アプリケーションに信頼性の高い OCR 機能を組み込みたいすべての開発者にとって理想的な選択肢です。

概要

Baidu-OCR-API の機能概要です。

Features Overview

OCR を実行
OCR 機能を追加
画像テキストを認識
テキスト画像を変換
フォントテキストを認識
PDF を検索
100 以上の言語に対応
OCR アプリを作成
ブラウザに保存
テキストを抽出
マルチスレッド対応

Baidu-OCR-API

Baidu-OCR-API は、以下に示す一般的な画像ファイル形式をサポートしています。

リーダー

PNG, JPEG, BMP, TIFF, TGA, DICOM

ライター

PNG, JPEG, BMP, TIFF

Baidu-OCR-API

プラットフォームの独立性

Baidu-OCR-API は、任意の Java ベースのプログラミング言語で動作できます

Java

Baidu-OCR-API

Baidu-OCR-API の開始方法

Baidu-OCR-API の推奨インストール方法は npm を使用することです。スムーズなインストールのために以下のコマンドをご利用ください

Install Baidu-OCR-API via npm

 npm install baidu-ocr-api -g

手動でインストールすることもできます。最新のリリースファイルは GitHub リポジトリから直接ダウンロードしてください。

Node.js アプリ内で画像からテキストを抽出する

Baidu-OCR-API は、ソフトウェア開発者が画像を読み込みテキストを抽出する作業を簡単に行えるようにします。汎用テキスト認識機能により、画像から印刷されたテキストを抽出でき、さまざまな文書に対応可能です。API は JPEG、PNG、GIF、TIFF、PDF、BMP など多数の一般的な画像ファイル形式をサポートしています。以下の例は、Node.js アプリケーション内で画像を読み込みテキスト認識を実行する方法を示しています。

How to Load and Perform Text Recognition on an Image inside Node.js Apps?

//Read image

const fs = require('fs');

// Read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

const image = readImage('path_to_your_image.jpg');

// Perform OCR
client.generalBasic(image).then(result => {
    console.log('Recognized Text:');
    result.words_result.forEach(wordInfo => {
        console.log(wordInfo.words);
    });
}).catch(err => {
    console.error(err);
});

Node.js アプリ内でのフォームとテーブルの認識

オープンソースの Baidu-OCR-API は、Node.js アプリケーション内でフォームとテーブルを認識する完全な機能を提供します。タスクを成功させるには、まず API 資格情報を使用して Baidu OCR クライアントを設定する必要があります。その後、画像を読み込みフォームとテーブルの認識を実行するコードを書きます。この機能は、構造化された文書からのデータ抽出を自動化し、さまざまなアプリケーションの生産性向上に特に有用です。以下は、Node.js 環境で画像を読み込みフォームとテーブルの認識を実行するシンプルな例です。

How to Read an Image and Perform Form and Table Recognition in Node.js Apps?

const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');

// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';

// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);

// Function to read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Form and Table Recognition
client.form(image).then(result => {
    console.log('Form and Table Data:');
    console.log(JSON.stringify(result, null, 2));
}).catch(err => {
    console.error('Error:', err);
});

Node.js API を使用した手書きテキスト認識

オープンソースの Baidu-OCR-API は非常に扱いやすく、Node.js アプリケーション内で高精度に手書きテキストを認識することができます。目的を達成するために、画像ファイルを読み込み Base64 文字列に変換し、その後 Handwriting メソッドを Base64 エンコードされた画像で呼び出します。認識された手書きテキストはコンソールに出力されます。以下の例は、Node.js でオープンソースの Baidu OCR API を使用して手書きテキスト認識を実行する方法を示しています。

How to Perform Handwriting Text Recognition inside Node.js Apps?

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
    console.log('Recognized Handwritten Text:');
    result.words_result.forEach(wordInfo => {
        console.log(word