1. 产品
  2.   OCR
  3.   Python
  4.   EasyOCR
 
  

用於整合 OCR 功能和提取文字的免費 Python API

開源 Python OCR API,用於從圖像和文件中進行準確快速的文字識別。使用 Python 庫讀取文件中的自然場景文字和密集文字。

光學字元辨識 (OCR) 技術已經存在一段時間了,它在各個行業中用於自動執行資料輸入和文件處理任務。 EasyOCR 是一款開源 OCR(光學字元辨識)引擎,快速、準確且易於使用。 它為開發人員提供了一個易於使用的介面,將 OCR 整合到他們的應用程式中。借助 EasyOCR 庫,軟體開發人員可以在幾秒鐘內從圖像和掃描文件中提取文本,使其成為文件管理、資料提取和自動化的理想工具。

EasyOCR 採用 Python 編寫,支援 80 多種語言,使其成為在多語言環境中運作的企業的強大工具。該庫有幾個重要的功能,例如準確的文本提取、多語言支援、與現有應用程式的簡單集成、定制OCR 引擎以滿足您的特定需求、經濟高效的解決方案、從掃描文檔中提取文本、接收和儲存提取的文字等等。該 API 是基於雲端的解決方案,不需要安裝任何硬體或軟體,這使其成為適合各種規模企業的經濟高效的解決方案。

EasyOCR API 使用深度學習演算法來實現高準確率,並且可以快速處理大量資料。它是一個靈活且可擴展的解決方案,可以使用簡單的 RESTful API 整合到現有工作流程中。 EasyOCR API 是一款功能強大的 OCR 解決方案,可協助各種規模的企業自動化資料輸入流程、提高準確性並降低成本。它支援多種語言,是文件管理、資料提取和自動化的理想工具。如果您正在尋找可整合到您的應用程式中的 OCR 引擎,請嘗試 EasyOCR。

Previous Next

EasyOCR 入門

安裝 EasyOCR 的建議方法是使用 pip。為了順利安裝,請使用以下命令。

透過 pip 安裝 EasyOCR

 pip install easyocr 

您也可以手動安裝;直接從 GitHub 儲存庫下載最新版本檔案。

透過Python API從影像中讀取和提取文字

開源 EasyOCR API 使用深度學習演算法從 Python 應用程式內的圖像和 PDF 檔案中載入、識別和提取文字。 EasyOCR 可以同時讀取多種語言,但它們必須相互相容。彼此共享大部分字元(例如拉丁文字)的語言是相容的。此API允許從影像中讀取和提取文本,包括如何預處理影像和調整OCR引擎的參數以提高準確性。以下範例展示如何從圖像中讀取和提取文字以及如何輕鬆地自動執行資料輸入任務。

透過Python API從圖像中讀取並提取文字

import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine

# Load the image and preprocess it

from PIL import Image
import cv2

image = Image.open('text_image.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_image.png')

# Use the OCR engine to extract text from the image.

result = reader.readtext(image, detail=0)

透過Python API辨識文字方塊中的字元

辨識文字方塊中的字元是 OCR 引擎的常見用例。開源 EasyOCR API 為此用例提供了功能強大且用戶友好的解決方案。它可以幫助軟體開發人員輕鬆識別文字方塊中的字符,以及如何預處理圖像並調整 OCR 引擎的參數以提高準確性。文字方塊可以具有不同的形狀、大小和方向,這可能會影響 OCR 引擎的準確性。因此,應用一些預處理步驟可以提高OCR引擎的準確性,例如影像校正、應用二值化和應用降噪。

如何透過Python API辨識文字方塊中的字元?

import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine

# Load the image and preprocess it

from PIL import Image
import cv2

image = Image.open('text_box.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_box.png')

# OCR engine to recognize the characters in the text box

result = reader.readtext(image, detail=0)

# The result is a list of strings, where each string represents a recognized character in the text box.

 中国人