1. محصولات
  2.   OCR
  3.   Python
  4.   Aspose.OCR for Python via .NET

Aspose.OCR for Python via .NET

 
 

خواندن و استخراج متن از تصاویر با API پایتون

API قدرتمند OCR پایتون پیشرو به توسعه‌دهندگان امکان خواندن و استخراج متن از تصاویر، عکس‌ها، اسکرین‌شات‌ها، اسناد اسکن‌شده و فایل‌های PDF را می‌دهد.

در عصر دیجیتال امروز، تبدیل تصاویر به فرمت‌های متنی قابل ویرایش به یک وظیفه حیاتی برای بسیاری از کسب‌وکارها و توسعه‌دهندگان تبدیل شده است. Aspose.OCR برای پایتون از طریق .NET یک راه‌حل قدرتمند برای تشخیص نوری کاراکتر (OCR) ارائه می‌دهد که به توسعه‌دهندگان نرم‌افزار امکان استخراج متن از تصاویر را به‌صورت آسان می‌دهد. Aspose.OCR برای پایتون از طریق .NET یک کتابخانه قدرتمند برای وظایف OCR است. این کتابخانه بخشی از مجموعه محصولات Aspose است که به‌خاطر ارائه ابزارهای پردازش سند با کیفیت بالا شناخته شده است. این کتابخانه به توسعه‌دهندگان اجازه می‌دهد تا از قابلیت‌های چارچوب .NET در حین برنامه‌نویسی با پایتون بهره‌برداری کنند و به این ترتیب برنامه‌های چندپلتفرمی که می‌توانند عملیات OCR را به‌صورت یکپارچه انجام دهند، فراهم می‌شود. این کتابخانه تشخیص متن را در بیش از ۱۰۰ زبان، از جمله انگلیسی، اسپانیایی، فرانسوی، آلمانی، ایتالیایی، چینی، ژاپنی و بسیاری دیگر پشتیبانی می‌کند.

Aspose.OCR برای پایتون از طریق .NET یک کتابخانه OCR مبتنی بر .NET است که به توسعه‌دهندگان امکان تشخیص و استخراج متن از فرمت‌های مختلف تصویر، از جمله JPEG، PNG، GIF، BMP و TIFF را می‌دهد. این API از الگوریتم‌های پیشرفته برای اطمینان از دقت بالا در تشخیص متن از فرمت‌های مختلف تصویر استفاده می‌کند. این کتابخانه تشخیص متن در فونت‌ها و سبک‌های مختلف را پشتیبانی می‌کند. برای افزایش دقت تشخیص، Aspose.OCR قابلیت‌های پیش‌پردازش مانند باینری‌سازی، اصلاح انحراف و حذف نویز را ارائه می‌دهد. این موارد به آماده‌سازی تصاویر برای نتایج بهتر OCR کمک می‌کند. این کتابخانه می‌تواند چندین تصویر را در یک فرآیند مدیریت کند و پردازش دسته‌ای را امکان‌پذیر سازد و در سناریوهایی که حجم زیادی از تصاویر باید پردازش شوند، زمان را صرفه‌جویی کند. با ویژگی‌های پیشرفته خود، از جمله پشتیبانی چندزبانه، پیش‌پردازش تصویر، تحلیل چیدمان و مدیریت خطا، Aspose.OCR یک انتخاب ایده‌آل برای توسعه‌دهندگان نرم‌افزار است که مایل به کار بر روی پروژه‌های مبتنی بر OCR هستند.

Previous Next

شروع کار با Aspose.OCR برای پایتون از طریق .NET

روش پیشنهادی برای نصب Aspose.OCR برای پایتون از طریق .NET استفاده از pip است. لطفاً برای نصب روان، فرمان زیر را استفاده کنید.

Install Aspose.OCR for Python via .NET via pip

 pip install aspose-ocr-python-net

می‌توانید SDK را مستقیماً از صفحه محصول Aspose.OCR Python Cloud SDK دانلود کنید.

عملیات OCR با دقت بالا با پایتون

Aspose.OCR برای پایتون از طریق .NET برای دقت و صحت بالا طراحی شده است. این کتابخانه مدل‌های پیشرفته یادگیری ماشین را شامل می‌شود که دقت استخراج متن را حتی در تصاویر کج یا با وضوح پایین بهبود می‌بخشد. این ویژگی آن را برای برنامه‌هایی که به تشخیص متن قابل اعتماد نیاز دارند، مانند استخراج خودکار داده‌ها از فرم‌ها یا اسناد اسکن‌شده، مناسب می‌سازد. قطعه کد زیر یک پیاده‌سازی ساده را نشان می‌دهد که در آن یک تصویر بارگذاری، پردازش می‌شود و متن شناسایی‌شده آن نمایش داده می‌شود.

چگونه تصاویر را بارگذاری، OCR انجام داده و متن را از طریق API پایتون استخراج کنیم؟

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

قابلیت‌های پیش‌پردازش تصویر

کتابخانه Aspose.OCR برای پایتون از طریق .NET ویژگی‌های قدرتمند پیش‌پردازش تصویر را در برنامه‌های پایتون ارائه می‌دهد. این ویژگی‌ها دقت OCR را با اصلاح انحراف، حذف نویز و نرمال‌سازی تصویر بهبود می‌بخشند. این مراحل پیش‌پردازش هنگام کار با تصاویری که ممکن است تحت شرایط نامناسب اسکن شده باشند، حیاتی هستند. مثال زیر نشان می‌دهد که چگونه توسعه‌دهندگان می‌توانند عملیات اصلاح انحراف را انجام دهند که تضمین می‌کند متن حتی اگر تصویر کمی کج یا به‌طور کامل هم‌راستا نباشد، به‌دقت تشخیص داده شود.

چگونه عملیات OCR را با اصلاح انحراف در برنامه‌های پایتون انجام دهیم؟

from aspose.ocr import OcrEngine, SkewCorrection

ocr_engine = OcrEngine()

# Enable skew correction
ocr_engine.set_skew_correction(SkewCorrection.True)

ocr_engine.image = "skewed_image.png"
recognized_text = ocr_engine.get_text()
print("Corrected and Recognized Text:", recognized_text)

تشخیص متن دست‌نویس با پایتون

Aspose.OCR برای پایتون از طریق .NET بسیار آسان برای استفاده است و می‌تواند متن چاپی و دست‌نویس را تنها با چند خط کد پایتون تشخیص دهد. این ویژگی برای برنامه‌هایی مانند دیجیتالی‌سازی یادداشت‌ها یا امضاهای دست‌نویس بسیار مفید است. توانایی نرم‌افزار در تفسیر سبک‌های مختلف متن، کاربرد آن را در حوزه‌هایی مانند آموزش و مستندات قانونی افزایش می‌دهد. در ادامه مثالی آورده شده که نشان می‌دهد چگونه می‌توان تشخیص متن دست‌نویس را با استفاده از کد پایتون انجام داد.

چگونه تشخیص متن دست‌نویس را با کتابخانه پایتون انجام دهیم؟

api = ocr.AsposeOcr()

''' add filters if you need '''
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
#filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.contrast_correction_filter())

''' initialize image collection and put images into it '''
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
input.add("Data\\OCR\\handwritten.jpg")

''' change recognition options if you need '''
settings = ocr.RecognitionSettings()
settings.detect_areas_mode=ocr.DetectAreasMode.PHOTO

''' run recognition '''
res = api.recognize_handwritten_text(input)
print(res[0].recognition_text)

منطقه‌های سفارشی تصویر OCR در برنامه‌های پایتون

Aspose.OCR برای پایتون از طریق .NET پشتیبانی کامل از تشخیص متن از ناحیه خاصی از یک تصویر در برنامه‌های پایتون را فراهم کرده است. توسعه‌دهندگان می‌توانند نواحی خاصی را در یک تصویر برای OCR مشخص کنند که در سناریوهایی که تنها بخشی از تصویر حاوی متن مرتبط است، مفید است. توسعه‌دهندگان می‌توانند نواحی سفارشی برای OCR بر روی تصویر تعریف کنند، حالت‌های تشخیص را تنظیم کرده و پارامترهای دیگر را برای بهینه‌سازی فرآیند OCR بر اساس نیازهای خاص برنامه تنظیم نمایند. در ادامه مثالی آورده شده که نشان می‌دهد چگونه توسعه‌دهندگان می‌توانند یک خط متن را تنها با چند خط کد پایتون تشخیص دهند.

چگونه یک خط متن را بر روی تصویر در برنامه‌های پایتون تشخیص دهیم؟

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)
 فارسی