JS プロジェクトに OCR 機能を追加する無料の Node.js API

さまざまなファイル形式（画像（JPEG、PNG）、PDF、ドキュメント）からテキストを認識・抽出できるオープンソースの Node.js OCR ライブラリで、プログラマーは多言語で無料で利用できます。

Node-Tesseract-OCR とは？

今日のデジタル時代において、画像やドキュメントからテキストを抽出することは、文書管理、データ処理、人工知能などさまざまな業界で重要なタスクとなっています。光学文字認識（OCR）技術により、スキャンした文書、画像、PDF を編集可能なテキスト形式に変換できるようになりました。Node-Tesseract-OCR は、Tesseract OCR エンジンのパワーを組み込んだオープンソース API で、Node.js アプリケーションで OCR タスクをシームレスかつ効率的に実行できます。

Node-Tesseract-OCR は Tesseract OCR エンジンの Node.js ラッパーであり、ソフトウェア開発者が Node.js 環境内で Tesseract の強力なテキスト認識機能を利用できます。この API は GitHub リポジトリで管理されており、シンプルなテキスト抽出から複雑な文書処理まで幅広いユースケースに対応する機能を提供します。開発者は複数言語で画像や文書からテキストを抽出でき、さまざまなアプリケーションに活用できます。

Node-Tesseract-OCR API は、画像フィルタリング、リサイズ、クロップなどの高度な画像処理機能を提供し、抽出されたテキストの正確性と信頼性を確保します。100 以上の言語をサポートし、多様な環境での OCR タスクに柔軟に対応できます。開発者は画像、PDF、文書からテキストを抽出し、JSON、XML、プレーンテキストなどさまざまな形式で結果を取得できます。軽量で柔軟、使いやすい設計のため、プロジェクトに OCR 機能を追加したい開発者に最適です。高度な画像処理、言語サポート、エラーハンドリング機構を備えており、OCR 機能をプロジェクトに組み込む際の理想的な選択肢です。

概要

Node-Tesseract-OCR の機能概要です。

機能概要

OCR を実行
OCR 機能を追加
画像テキストを認識
テキスト画像を変換
フォントテキストを認識
PDF を検索
100 以上の言語をサポート
OCR アプリを作成
ブラウザに保存
テキストを抽出
マルチスレッド対応

Node-Tesseract-OCR

Node-Tesseract-OCR は以下の一般的な画像ファイル形式をサポートしています。

リーダー

PNG, JPEG, BMP, TIFF, TGA, DICOM

ライター

PNG, JPEG, BMP, TIFF

Node-Tesseract-OCR

プラットフォームの独立性

Node-Tesseract-OCR は任意の Java ベースのプログラミング言語で動作できます

Java

Node-Tesseract-OCR

Node-Tesseract-OCR の開始方法

Node-Tesseract-OCR をインストールする推奨方法は npm を使用することです。スムーズなインストールのために以下のコマンドをご利用ください

npm で Node-Tesseract-OCR をインストール

npm install node-tesseract-ocr

手動でインストールすることもできます。最新のリリースファイルは GitHub リポジトリから直接ダウンロードしてください。

Node.js API における画像からのテキスト抽出

オープンソースの Node-Tesseract-OCR ライブラリは、ソフトウェア開発者が Node.js アプリケーション内で画像からテキストを自動的に抽出するアプリケーションを簡単に作成できるようにします。スキャンした文書、PDF、カメラ写真、領収書の写真からのテキスト抽出をサポートします。これにより、検索可能なアーカイブの作成、データ入力の自動化、金融や医療などの分野で大量の文書を処理する際に役立ちます。以下は、Node.js アプリケーション内で画像からテキストをプログラム的に抽出する簡単な例です。

Node.js 環境内で画像からテキストを抽出する方法

const tesseract = require("node-tesseract-ocr");

tesseract.recognize("path/to/image.jpg")
  .then(text => {
    console.log("Recognized Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Node.js 内での画像前処理の改善

OCR を適用する前に画像を前処理することで、文字認識の精度を大幅に向上させることができます。オープンソースの Node-Tesseract-OCR ライブラリは、リサイズ、二値化、デスキューなどの基本的な前処理手法をサポートしています。これらの前処理ステップは、sharp や jimp といった追加の Node.js ライブラリと組み合わせて実装できます。以下の例は、低品質画像でも認識率を向上させるために前処理ステップを使用する方法を示しています。

Node.js API を介して前処理ステップを適用し、認識率を向上させる方法

const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");

sharp("path/to/input.jpg")
  .resize(800, 600) // 画像をリサイズ
  .greyscale() // グレースケールに変換
  .toBuffer()
  .then(data => {
    return tesseract.recognize(data, { lang: "eng" });
  })
  .then(text => {
    console.log("Preprocessed Image Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

多言語での認識テキスト

Node-Tesseract-OCR の際立った特徴のひとつは、豊富な多言語サポートです。Tesseract OCR ライブラリは 100 以上の言語をサポートしており、さまざまな言語の文書を処理するアプリケーションに最適です。開発者は使用したい言語を指定でき、英語以外のテキストの認識精度を向上させることができます。以下は、Node.js アプリケーション内でフランス語のテキストを認識する例です。

JavaScript API を使用して画像のフランス語テキストを認識する方法

const config = {
  lang: "fra", // フランス語サポート
  oem: 1,
  psm: 3
};

tesseract.recognize("path/to/french-text-image.jpg", config)
  .then(text => {
    console.log("Recognized Text in French:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });