1. محصولات
  2.   OCR
  3.   Python
  4.   EasyOCR
 
  

API رایگان پایتون برای ادغام قابلیت های OCR و استخراج متن

Python OCR API منبع باز برای تشخیص دقیق و سریع متن از تصاویر و اسناد. با استفاده از کتابخانه پایتون هم متن صحنه طبیعی و هم متن متراکم را در سند بخوانید.

فناوری تشخیص کاراکتر نوری (OCR) مدتی است که وجود داشته است، و در صنایع مختلف برای خودکارسازی کارهای ورود داده و پردازش اسناد استفاده می‌شود. EasyOCR یک موتور OCR (تشخیص کاراکتر نوری) منبع باز است که سریع، دقیق و آسان برای استفاده است. این یک رابط کاربری آسان برای توسعه دهندگان فراهم می کند تا OCR را در برنامه های خود ادغام کنند. با کتابخانه EasyOCR، توسعه دهندگان نرم افزار می توانند متن را از تصاویر و اسناد اسکن شده در عرض چند ثانیه استخراج کنند و آن را به ابزاری ایده آل برای مدیریت اسناد، استخراج داده ها و اتوماسیون تبدیل کنند.

EasyOCR به زبان پایتون نوشته شده است و از بیش از 80 زبان پشتیبانی می‌کند و آن را به ابزاری قدرتمند برای کسب‌وکارهایی تبدیل می‌کند که در محیط‌های چند زبانه فعالیت می‌کنند. چندین ویژگی مهم در کتابخانه وجود دارد مانند استخراج متن دقیق، پشتیبانی چند زبانه، ادغام ساده با برنامه های موجود، سفارشی کردن موتور OCR برای رفع نیازهای خاص شما، راه حل های مقرون به صرفه، استخراج متن از اسناد اسکن شده، دریافت و ذخیره. متن استخراج شده و بسیاری موارد دیگر. API یک راه حل مبتنی بر ابر است که نیازی به نصب سخت افزار یا نرم افزار ندارد و آن را به یک راه حل مقرون به صرفه برای مشاغل در هر اندازه تبدیل می کند.

EasyOCR API از الگوریتم‌های یادگیری عمیق برای دستیابی به نرخ‌های دقت بالا استفاده می‌کند و می‌تواند حجم زیادی از داده‌ها را به سرعت پردازش کند. این یک راه حل انعطاف پذیر و مقیاس پذیر است که می تواند با استفاده از یک API ساده RESTful در جریان های کاری موجود ادغام شود. EasyOCR API یک راه حل قدرتمند OCR است که می تواند به مشاغل در هر اندازه کمک کند فرآیندهای ورود داده خود را خودکار کنند، دقت را بهبود بخشند و هزینه ها را کاهش دهند. با پشتیبانی از چندین زبان، ابزاری ایده آل برای مدیریت اسناد، استخراج داده ها و اتوماسیون است. اگر به دنبال یک موتور OCR برای ادغام در برنامه خود هستید، EasyOCR را امتحان کنید.

Previous Next

شروع به کار با EasyOCR

روش توصیه شده برای نصب EasyOCR استفاده از pip است. لطفا از دستور زیر برای نصب راحت استفاده کنید.

EasyOCR را از طریق پیپ

نصب کنید
 pip install easyocr 

همچنین می توانید آن را به صورت دستی نصب کنید. آخرین فایل های نسخه را مستقیماً از مخزن GitHub دانلود کنید.

خواندن و استخراج متن از تصویر از طریق Python API

EasyOCR API منبع باز از الگوریتم های یادگیری عمیق برای بارگیری، شناسایی و استخراج متن از تصاویر و فایل های PDF در برنامه های پایتون استفاده می کند. EasyOCR می تواند چندین زبان را به طور همزمان بخواند اما آنها باید با یکدیگر سازگار باشند. زبان هایی که بیشتر کاراکترها را به اشتراک می گذارند (مانند خط لاتین) با یکدیگر سازگار هستند. API به خواندن و استخراج متن از تصاویر، از جمله نحوه پیش پردازش تصاویر و تنظیم پارامترهای موتور OCR برای بهبود دقت، اجازه می دهد. مثال زیر نحوه خواندن و استخراج متن از تصاویر و خودکارسازی وظایف ورود اطلاعات را به آسانی نشان می دهد.

خواندن و استخراج متن از تصاویر از طریق Python API

import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine

# Load the image and preprocess it

from PIL import Image
import cv2

image = Image.open('text_image.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_image.png')

# Use the OCR engine to extract text from the image.

result = reader.readtext(image, detail=0)

تشخیص کاراکترها از Text Boxes از طریق Python API

تشخیص کاراکترها از جعبه های متنی یک مورد رایج برای موتورهای OCR است. EasyOCR API منبع باز یک راه حل قدرتمند و کاربر پسند برای این مورد استفاده می کند. این به توسعه دهندگان نرم افزار کمک می کند تا کاراکترهای جعبه های متن را به راحتی تشخیص دهند و چگونه تصاویر را پیش پردازش کنند و پارامترهای موتور OCR را برای بهبود دقت تنظیم کنند. جعبه های نوشتاری می توانند اشکال، اندازه ها و جهت های مختلفی داشته باشند و این می تواند بر دقت موتور OCR تأثیر بگذارد. بنابراین اعمال برخی از مراحل پیش پردازش می تواند دقت موتور OCR را بهبود بخشد، مانند Deskew the image، Apply binarization و Apply Noise.

چگونه کاراکترها را از Text Box ها از طریق Python API شناسایی کنیم؟

import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine

# Load the image and preprocess it

from PIL import Image
import cv2

image = Image.open('text_box.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_box.png')

# OCR engine to recognize the characters in the text box

result = reader.readtext(image, detail=0)

# The result is a list of strings, where each string represents a recognized character in the text box.

 فارسی