API رایگان پایتون برای ادغام قابلیت های OCR و استخراج متن
Python OCR API منبع باز برای تشخیص دقیق و سریع متن از تصاویر و اسناد. با استفاده از کتابخانه پایتون هم متن صحنه طبیعی و هم متن متراکم را در سند بخوانید.
فناوری تشخیص کاراکتر نوری (OCR) مدتی است که وجود داشته است، و در صنایع مختلف برای خودکارسازی کارهای ورود داده و پردازش اسناد استفاده میشود. EasyOCR یک موتور OCR (تشخیص کاراکتر نوری) منبع باز است که سریع، دقیق و آسان برای استفاده است. این یک رابط کاربری آسان برای توسعه دهندگان فراهم می کند تا OCR را در برنامه های خود ادغام کنند. با کتابخانه EasyOCR، توسعه دهندگان نرم افزار می توانند متن را از تصاویر و اسناد اسکن شده در عرض چند ثانیه استخراج کنند و آن را به ابزاری ایده آل برای مدیریت اسناد، استخراج داده ها و اتوماسیون تبدیل کنند.
EasyOCR به زبان پایتون نوشته شده است و از بیش از 80 زبان پشتیبانی میکند و آن را به ابزاری قدرتمند برای کسبوکارهایی تبدیل میکند که در محیطهای چند زبانه فعالیت میکنند. چندین ویژگی مهم در کتابخانه وجود دارد مانند استخراج متن دقیق، پشتیبانی چند زبانه، ادغام ساده با برنامه های موجود، سفارشی کردن موتور OCR برای رفع نیازهای خاص شما، راه حل های مقرون به صرفه، استخراج متن از اسناد اسکن شده، دریافت و ذخیره. متن استخراج شده و بسیاری موارد دیگر. API یک راه حل مبتنی بر ابر است که نیازی به نصب سخت افزار یا نرم افزار ندارد و آن را به یک راه حل مقرون به صرفه برای مشاغل در هر اندازه تبدیل می کند.
EasyOCR API از الگوریتمهای یادگیری عمیق برای دستیابی به نرخهای دقت بالا استفاده میکند و میتواند حجم زیادی از دادهها را به سرعت پردازش کند. این یک راه حل انعطاف پذیر و مقیاس پذیر است که می تواند با استفاده از یک API ساده RESTful در جریان های کاری موجود ادغام شود. EasyOCR API یک راه حل قدرتمند OCR است که می تواند به مشاغل در هر اندازه کمک کند فرآیندهای ورود داده خود را خودکار کنند، دقت را بهبود بخشند و هزینه ها را کاهش دهند. با پشتیبانی از چندین زبان، ابزاری ایده آل برای مدیریت اسناد، استخراج داده ها و اتوماسیون است. اگر به دنبال یک موتور OCR برای ادغام در برنامه خود هستید، EasyOCR را امتحان کنید.
شروع به کار با EasyOCR
روش توصیه شده برای نصب EasyOCR استفاده از pip است. لطفا از دستور زیر برای نصب راحت استفاده کنید.
EasyOCR را از طریق پیپ
نصب کنید pip install easyocr
همچنین می توانید آن را به صورت دستی نصب کنید. آخرین فایل های نسخه را مستقیماً از مخزن GitHub دانلود کنید.
خواندن و استخراج متن از تصویر از طریق Python API
EasyOCR API منبع باز از الگوریتم های یادگیری عمیق برای بارگیری، شناسایی و استخراج متن از تصاویر و فایل های PDF در برنامه های پایتون استفاده می کند. EasyOCR می تواند چندین زبان را به طور همزمان بخواند اما آنها باید با یکدیگر سازگار باشند. زبان هایی که بیشتر کاراکترها را به اشتراک می گذارند (مانند خط لاتین) با یکدیگر سازگار هستند. API به خواندن و استخراج متن از تصاویر، از جمله نحوه پیش پردازش تصاویر و تنظیم پارامترهای موتور OCR برای بهبود دقت، اجازه می دهد. مثال زیر نحوه خواندن و استخراج متن از تصاویر و خودکارسازی وظایف ورود اطلاعات را به آسانی نشان می دهد.
خواندن و استخراج متن از تصاویر از طریق Python API
import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine
# Load the image and preprocess it
from PIL import Image
import cv2
image = Image.open('text_image.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_image.png')
# Use the OCR engine to extract text from the image.
result = reader.readtext(image, detail=0)
تشخیص کاراکترها از Text Boxes از طریق Python API
تشخیص کاراکترها از جعبه های متنی یک مورد رایج برای موتورهای OCR است. EasyOCR API منبع باز یک راه حل قدرتمند و کاربر پسند برای این مورد استفاده می کند. این به توسعه دهندگان نرم افزار کمک می کند تا کاراکترهای جعبه های متن را به راحتی تشخیص دهند و چگونه تصاویر را پیش پردازش کنند و پارامترهای موتور OCR را برای بهبود دقت تنظیم کنند. جعبه های نوشتاری می توانند اشکال، اندازه ها و جهت های مختلفی داشته باشند و این می تواند بر دقت موتور OCR تأثیر بگذارد. بنابراین اعمال برخی از مراحل پیش پردازش می تواند دقت موتور OCR را بهبود بخشد، مانند Deskew the image، Apply binarization و Apply Noise.
چگونه کاراکترها را از Text Box ها از طریق Python API شناسایی کنیم؟
import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine
# Load the image and preprocess it
from PIL import Image
import cv2
image = Image.open('text_box.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_box.png')
# OCR engine to recognize the characters in the text box
result = reader.readtext(image, detail=0)
# The result is a list of strings, where each string represents a recognized character in the text box.