
Aspose.OCR library for Node.js via C++
画像のテキストを認識/抽出する Node.js OCR ライブラリ
Node.js OCR API は、ソフトウェア開発者が画像、スキャン文書、写真、スクリーンショットからテキストを抽出し、テキスト認識を伴うタスクを自動化できるようにします。
Node.js 用 Aspose.OCR ライブラリ(C++ 経由) は、Node.js アプリケーションで作業するソフトウェア開発者向けに光学文字認識(OCR)機能を提供する強力なライブラリです。このライブラリは、堅牢で信頼性の高い文書処理ソリューションで知られる Aspose スイートの一部であり、主な機能は画像、スキャン文書、写真、スクリーンショットなどからテキストを認識・抽出できることです。印刷されたテキストに加えて手書きテキストも認識できるため、さまざまな文書での利用範囲が広がります。プレーンテキストの抽出に加えて、認識したテキストのフォントスタイル、サイズ、カラーなどの書式情報も保持できます。
Aspose.OCR for Node.js ライブラリの際立った特徴のひとつは、JPEG、PNG、BMP、TIFF など多数の画像フォーマットに対応していることです。この汎用性により、開発者は幅広い画像を扱うことができ、さまざまな文書やグラフィックの処理が容易になります。さらに、正確で信頼性の高いテキスト抽出を実現する高度な OCR アルゴリズムを提供しています。高度な認識技術を活用することで、テキストが傾いていたり、ぼやけていたり、歪んでいる場合でも、画像から効果的にテキストを解釈できます。
Aspose.OCR for Node.js は複数の言語に対応しており、グローバルなアプリケーションに適しています。英語、スペイン語、フランス語、ドイツ語、イタリア語、ポルトガル語、中国語、日本語など、130 以上の言語のテキストを認識できます。パフォーマンスとスケーラビリティを考慮して設計されており、大量の画像を効率的に処理できます。また、構造化された文書用にカスタムテンプレートを定義することが可能です。この機能は、フォームや請求書、その他のテンプレート文書から特定のフィールドを抽出する際に有用です。総じて、Aspose.OCR ライブラリは、Node.js アプリケーションに OCR 機能を組み込む開発者にとって価値あるツールです。
Node.js 用 Aspose.OCR ライブラリ(C++ 経由)の開始方法
Node.js 用 Aspose.OCR ライブラリ(C++ 経由)をインストールする推奨方法は npm を使用することです。スムーズなインストールのために以下のコマンドをご利用ください。
npm で Node.js 用 Aspose.OCR ライブラリ(C++ 経由)をインストール
npm install aspose-ocr-cloud ライブラリは直接 Aspose.OCR 製品ページからダウンロードできます
Node.js 用 Aspose.OCR ライブラリ(C++ 経由)は、さまざまな画像に対して光学文字認識(OCR)操作を実行するための完全な機能を提供します。数行のコードだけで、ソフトウェア開発者は Node.js アプリケーション内で画像からテキストを認識・抽出できます。API は JPEG、PNG、GIF、TIFF、PDF、BMP などの一般的な画像ファイル形式をサポートしています。回転、歪み、ノイズのある画像の認識など、ライブラリに含まれる重要な機能も多数あります。さらに、認識結果を最も一般的な文書・データ交換フォーマットで保存できます。以下の例は、JavaScript コマンドを使用して画像を読み込み、テキストを抽出する方法を示しています。Node.js アプリで画像からテキストを認識する方法
let source = Module.WasmAsposeOCRInput();
source.url = internalFileName;
let batch = new Module.WasmAsposeOCRInputs();
batch.push_back(source);
// Send image for OCR
var result = Module.AsposeOCRRecognize(batch);
// Output extracted text to the console
var text = Module.AsposeOCRSerializeResult(
result, Module.ExportFormat.text);
console.log(text);
Node.js アプリでの手書きテキスト認識
Node.js アプリで画像からテキストを認識する方法
let source = Module.WasmAsposeOCRInput();
source.url = internalFileName;
let batch = new Module.WasmAsposeOCRInputs();
batch.push_back(source);
// Send image for OCR
var result = Module.AsposeOCRRecognize(batch);
// Output extracted text to the console
var text = Module.AsposeOCRSerializeResult(
result, Module.ExportFormat.text);
console.log(text);
Aspose.OCR ライブラリ(C++ 経由)は、開発者が自分の Node.js アプリケーション内で手書きテキストを認識できるようにします。印刷されたテキストに加えて手書きテキストも認識できるため、さまざまな文書での利用範囲が広がります。手書きテキストモードを有効にすることで手書きテキストを認識できます。また、画像をローカルにダウンロードせずに URL から直接認識することも可能です。以下の例は、Node.js アプリケーション内で手書きテキストを読み込み、認識する方法を示しています。
Node.js アプリで手書きテキストを認識する方法
const recognizeHandwritten = true;
ocrApi.recognizeFromContent('eng', recognizeHandwritten, imageBuffer, (error, data) => {
if (error) throw error;
console.log('Extracted Handwritten Text:', data.text);
});
テンプレートベースの認識サポート
テンプレートベースの認識は、文書内のレイアウトや関心領域を指定するテンプレートを定義することを含みます。Node.js 用 Aspose.OCR ライブラリ(C++ 経由)によるテンプレートベースの認識は、固定レイアウトの文書からデータを構造化かつ正確に抽出する方法を提供します。この機能は、フォーム、請求書、その他のテンプレート文書から特定のフィールドを抽出する際に有用です。以下は、テンプレートをロードし、画像に適用して OCR を実行する方法を示す非常に有用な例です。
Node.js アプリでテンプレートをロードし、画像に適用して OCR を実行する方法
const fs = require('fs');
const { OcrApi, AsposeApp, TemplateApi } = require('aspose-ocr-cloud');
const appSid = 'your-app-sid';
const appKey = 'your-app-key';
AsposeApp.appSID = appSid;
AsposeApp.appKey = appKey;
const ocrApi = new OcrApi();
const templateApi = new TemplateApi();
const imagePath = 'path/to/your/invoice.jpg';
const templatePath = 'path/to/your/template.json';
fs.readFile(imagePath, (err, imageBuffer) => {
if (err) throw err;
fs.readFile(templatePath, (err, templateBuffer) => {
if (err) throw err;
// Load the template
templateApi.addTemplate(templateBuffer, (error, templateId) => {
if (error) throw error;
// Apply the template to the image
ocrApi.recognizeFromTemplate(imageBuffer, templateId, (error, result) => {
if (error) throw error;
console.log('Extracted Data:', result.fields);
});
});
});
});
OCR 操作でテキスト書式を保持する
OCR 操作中にテキスト書式を保持することは、テキストの構造、フォントスタイル、レイアウトが重要なアプリケーションにとって不可欠です。プレーンテキストの抽出に加えて、Node.js 用 Aspose.OCR ライブラリ(C++ 経由)は、フォントスタイル、サイズ、カラーなどの書式情報を含む認識テキストの書式も保持できます。テキスト書式が重要な文書の処理に特に有用です。以下は、Aspose.OCR API を使用してテキスト書式を保持する方法を示す例です。
Node.js アプリで OCR 操作中にテキスト書式を保持する方法
const fs = require('fs');
const { OcrApi, AsposeApp, OCRFormat, OCRRecognitionSettings } = require('aspose-ocr-cloud');
const appSid = 'your-app-sid';
const appKey = 'your-app-key';
AsposeApp.appSID = appSid;
AsposeApp.appKey = appKey;
const ocrApi = new OcrApi();
const imagePath = 'path/to/your/document.jpg';
fs.readFile(imagePath, (err, imageBuffer) => {
if (err) throw err;
const recognitionSettings = new OCRRecognitionSettings();
recognitionSettings.setDetectAreas(true);
recognitionSettings.setDetectText(true);
recognitionSettings.setDetectItalic(true);
recognitionSettings.setDetectBold(true);
ocrApi.recognizeWithSettings(imageBuffer, OCRFormat.TEXT, recognitionSettings, (error, data) => {
if (error) throw error;
const formattedText = data.text;
const formattingDetails = data.textAreas;
console.log('Extracted Text with Formatting:', formattedText);
console.log('Formatting Details:', formattingDetails);
});
});
