画像をオンラインでテキストに変換するオープンソース Ruby ライブラリ

無料の Ruby 光学式文字認識 (OCR) ライブラリにより、ソフトウェア開発者は画像、PDF、またはスキャンされたドキュメントをロード、読み取り、テキストまたは検索可能なドキュメントに変換できます

光学式文字認識 (OCR) テクノロジーは近年大幅に進歩し、さまざまなソースからのデータ抽出の自動化が容易になりました。これにより、自動化が可能になり、データへのアクセスが向上し、さまざまなドメインの生産性が向上します。そのような強力なツールの 1 つが OcrSpace Ruby ライブラリで、開発者に OCR 機能を Ruby アプリケーションに統合するための簡単なソリューションを提供します。このライブラリは、画像、スキャンしたドキュメント、PDF ファイルからテキストを抽出するプロセスを簡素化し、便利な OCR ソリューションを求める開発者にとって優れた選択肢となります。

OcrSpace Ruby ライブラリは、簡単で直感的なインターフェイスを提供し、OCR 機能を Ruby アプリケーションに簡単に統合できます。ライブラリには、さまざまな種類の画像のロード、画像からのテキストの抽出、スキャンされた文書のテキストへの変換、複数の言語で書かれた文書からのテキストの抽出、低解像度の画像からのテキストの認識、手書きコンテンツの操作など、重要な機能がいくつかあります。、認識されたテキストの座標の取得、ページ番号の検出、特定の関心領域の識別など。

OcrSpace Ruby ライブラリは、Ocr.Space OCR API のラッパーであり、画像や PDF ドキュメントから信頼性が高く正確なテキスト抽出を提供します。 Ruby 開発者向けに特別に構築されたこのライブラリは、統合プロセスを簡素化し、プログラマーが基礎となる API の複雑さに対処することなく、OCR 機能をアプリケーションに迅速に組み込むことができるようにします。ドキュメント管理システムの構築、データ抽出の自動化、アクセシビリティの強化のいずれの場合でも、OcrSpace Ruby ライブラリは、OCR プロセスを合理化し、アプリケーションに正確なテキスト抽出機能を提供する貴重なツールです。

概要

OcrSpace 機能の概要。

機能の概要

OCR を実行する
OCR 機能を追加する
画像テキストを認識する
URL 経由で画像をロードする
PDF tp テキストを変換
認識されたフォントテキスト
PDF を検索
他の言語
OCR アプリを作成する
ブラウザに保存
テキストの抽出
マルチスレッドのサポート

OcrSpace

OcrSpace は、以下に示す一般的な圧縮ファイル形式をサポートしています。

読者

PNG, JPEG, BMP, TIFF, TGA, DICOM

ライター

PNG, JPEG, BMP, TIFF

OcrSpace

プラットフォームの独立性

OcrSpace には Ruby ランタイムのみが必要です。

Ruby 5.1 以降

OcrSpace

OcrSpace の使い方

OcrSpace をインストールする推奨方法は、Rubygems を使用することです。スムーズにインストールするには、次のコマンドを使用してください。

Rubygems 経由で OcrSpace をインストール

$ gem install ocr_space

コンパイルされた共有ライブラリは、Github リポジトリからダウンロードできます。

Ruby API 経由で画像を URL からテキストに変換

オープンソースの OcrSpace ライブラリには、さまざまな種類の画像をロードし、数行の Ruby コードでテキストに変換するための強力な機能が含まれています。このライブラリは、画像、スキャンした文書、PDF ファイルからのテキスト抽出など、さまざまな OCR オプションをサポートしています。ソフトウェア開発者が請求書、領収書、またはその他の種類のドキュメントを処理する必要がある場合でも、OcrSpace Ruby ライブラリはそれを効率的に処理できます。次の例は、ソフトウェア開発者が Ruby API を使用して URL 経由で画像をテキストに変換する方法を示しています。

Ruby API 経由で URL から画像を変換

result = resource.convert url: "http://bit.ly/2ih9aXt"

puts result
=>  #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]

result = resource.clean_convert url: "http://bit.ly/2ih9aXt"

puts result

=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES

Ruby API による高度な OCR 機能

オープンソースの OcrSpace ライブラリには、Ruby アプリケーション内で OCR 操作を処理するための非常に便利で高度な機能がいくつか含まれています。低解像度の画像、歪んだテキスト、さらには手書きのコンテンツからもテキストを正確に認識し、さまざまなシナリオで信頼性の高い結果を保証します。テキスト抽出とは別に、このライブラリを使用すると、開発者はドキュメントから他の重要な情報を抽出することもできます。これには、認識されたテキストの座標の取得、ページ番号の検出、文書内の特定の関心領域の識別が含まれます。

Ruby API 経由でアップロードされたファイルからテキストを抽出する方法

result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result #Raw result

=>  #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}

result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result