開源 Ruby 庫可在線將圖像轉換為文本
免費的 Ruby 光學字元辨識 (OCR) 庫允許軟體開發人員載入、讀取影像、PDF 或掃描文件並將其轉換為文字或可搜尋文檔.
光學字元辨識 (OCR) 技術近年來取得了顯著進步,使得從各種來源自動擷取資料變得更加容易。它實現了自動化,提高了資料可訪問性,並提高了各個領域的生產力。 OcrSpace Ruby 程式庫就是這樣一個強大的工具,它為開發人員提供了將 OCR 功能整合到其 Ruby 應用程式中的簡單解決方案。該程式庫簡化了從圖像、掃描文件和 PDF 文件中提取文字的過程,使其成為尋求便捷 OCR 解決方案的開發人員的絕佳選擇。
OcrSpace Ruby 函式庫提供了簡單直覺的介面,可以輕鬆地將 OCR 功能整合到 Ruby 應用程式中。該庫有幾個重要的功能,例如載入各種類型的圖像、從圖像中提取文字、將掃描文件轉換為文字、從多種語言編寫的文件中提取文字、從低解析度圖像中識別文字、處理手寫內容、檢索已識別文字的座標、偵測頁碼、識別感興趣的特定區域等等。
OcrSpace Ruby 庫是 Ocr.Space OCR API 的包裝器,它提供從圖像和 PDF 文件中可靠且準確的文字提取。該程式庫專為 Ruby 開發人員構建,簡化了整合過程,使程式設計師能夠快速將 OCR 功能合併到他們的應用程式中,而無需處理底層 API 的複雜性。無論您是建立文件管理系統、自動化資料擷取還是增強可訪問性,OcrSpace Ruby 函式庫都是寶貴的工具,它可以簡化 OCR 流程並為您的應用程式提供準確的文字擷取功能。
OcrSpace 入門
安裝 OcrSpace 的建議方法是使用 Rubygems。為了順利安裝,請使用以下命令。
透過 Ruby API 將映像從 URL 轉換為文字
開源 OcrSpace 程式庫包含一些強大的功能,用於載入各種類型的圖像並使用幾行 Ruby 程式碼將它們轉換為文字。該程式庫支援各種 OCR 選項,包括從圖像、掃描文件和 PDF 文件中提取文字。無論軟體開發人員需要處理發票、收據或任何其他類型的文檔,OcrSpace Ruby 庫都可以有效地處理。 以下範例展示了軟體開發人員如何使用 Ruby API 透過 URL 將圖像轉換為文字。
透過 Ruby API 從 URL 轉換圖片
result = resource.convert url: "http://bit.ly/2ih9aXt"
puts result
=> #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]
result = resource.clean_convert url: "http://bit.ly/2ih9aXt"
puts result
=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES
透過 Ruby API 實現高階 OCR 功能
開源 OcrSpace 程式庫包含一些非常有用的進階功能,用於在 Ruby 應用程式中處理 OCR 操作。它可以準確識別低解析度圖像、扭曲文字甚至手寫內容中的文本,確保在各種場景下獲得可靠的結果。除了文字擷取之外,該庫還允許開發人員從文件中提取其他重要資訊。這包括檢索已識別文字的座標、偵測頁碼以及識別文件中感興趣的特定區域。
如何透過 Ruby API 從上傳的檔案中提取文字?result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result #Raw result
=> #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}
result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result
result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result #Raw result
=> #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}
result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result