1. 製品
  2.   OCR
  3.   JavaScript
  4.   Tesseract.js
 
  

Web アプリに OCR を追加および管理するためのオープンソース JavaScript API

JS Web アプリに光学式文字認識 (OCR) 機能を追加し、印刷または手書きのテキストの画像を機械可読テキストに無料で変換するための、最先端の無料 JavaScript ライブラリ。

Tesseract.js は、ソフトウェア開発者が最小限の労力とコストで光学式文字認識 (OCR) 機能を Web アプリケーション内に統合できるようにする非常に便利なオープンソース JavaScript ライブラリです。 OCR は、印刷または手書きのテキストの画像を機械可読テキストに変換するプロセスです。 Tesseract.js は、人気のある Tesseract OCR エンジンのポートです。このエンジンは、もともと 1980 年代に Hewlett-Packard によって開発され、その後 Google によって保守されました。 Tesseract.js は 100 以上の言語を認識できるため、Web アプリケーションに OCR 機能を追加しようとしている開発者にとって強力なツールとなります。

Tesseract.js は非常に扱いやすく、スキャンした文書、領収書、名刺からのテキストの抽出、データ入力タスクの自動化、Web アプリケーション内の検索機能の強化など、さまざまなタスクに使用できます。 Tesseract.js の主な利点の 1 つは、入力画像の品質や解像度が低い場合でもテキストを認識できることです。 このライブラリは機械学習アルゴリズムを使用して、OCR 結果の精度を向上させます。 また、ページ レイアウト分析を実行し、画像内の関心領域を検出することもできます。

Tesseract.js は、その使いやすさと強力な OCR 機能により人気が高まっており、ブラウザ上でも、NodeJS を備えたサーバー上でもスムーズに実行できます。 ソフトウェア開発者が言語、ページ セグメンテーション モード、ホワイトリスト文字などの OCR オプションを構成できるシンプルな API を提供します。 低品質の画像からテキストを認識する機能と複数の言語のサポートにより、幅広いアプリケーションにとって価値のあるツールとなり、Web アプリケーションに OCR を追加しようとしている開発者にとって優れた選択肢となります。

Previous Next

Tesseract.js の入門

Tesseract.js をインストールする推奨方法は、npm を使用することです。 スムーズにインストールするには、次のコマンドを使用してください。

npm 経由で Tesseract.js をインストールします

 npm install tesseract.js

手動でインストールすることもできます。 最新のリリース ファイルを GitHub リポジトリから直接ダウンロードします。

JavaScript API 経由で画像をテキストに変換

オープン ソースの JavaScript ライブラリ Tesseract.js を使用すると、ソフトウェア開発者は BMP、JPG、PNG、PBM、WebP などのさまざまなタイプの画像を簡単に操作できます。 このライブラリは、画像、PDF、スキャンされたドキュメント上のテキストの処理を自動化するために、画像からのテキストの抽出をサポートしています。 次の例は、わずか数行のコードで画像を読み込み、そこからテキストを抽出する方法を示しています。 language 引数は、画像の処理に使用するトレーニング済み言語データを決定するために使用されます。 ソフトウェア開発者はここで複数の言語を使用できます。

JavaScript API を使用して画像をテキストに変換するにはどうすればよいですか?

Tesseract.recognize(
  image,language,
  { 
    logger: m => console.log(m) 
  }
)
.catch (err => {
  console.error(err);
})
.then(result => {
 console.log(result);
})
}

JS API 経由で画像領域を読み取り、テキストを抽出する

オープンソースの JavaScript ライブラリには、画像内の特定の領域を読み取り、JavaScript アプリケーション内でそのデータをキャプチャするための非常に便利な機能が含まれています。 API は画像領域のキャプチャをサポートし、内部の強力な OCR エンジンを使用してこの領域内のテキストを認識しようとします。 次の例は、ソフトウェア開発者が画像への URL を提供し、API が選択した領域内のテキストを簡単に検出して認識する方法を示しています。

JS API 経由で画像の選択した領域のテキストを読み取り、認識する

const { createWorker } = require('tesseract.js');

const worker = await createWorker();
const rectangle = { left: 0, top: 0, width: 500, height: 250 };

(async () => {
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png', { rectangle });
  console.log(text);
  await worker.terminate();
})();
 日本