
Aspose.OCR for Python via .NET
خواندن و استخراج متن از تصاویر با API پایتون
API قدرتمند OCR پایتون پیشرو به توسعهدهندگان امکان خواندن و استخراج متن از تصاویر، عکسها، اسکرینشاتها، اسناد اسکنشده و فایلهای PDF را میدهد.
در عصر دیجیتال امروز، تبدیل تصاویر به فرمتهای متنی قابل ویرایش به یک وظیفه حیاتی برای بسیاری از کسبوکارها و توسعهدهندگان تبدیل شده است. Aspose.OCR برای پایتون از طریق .NET یک راهحل قدرتمند برای تشخیص نوری کاراکتر (OCR) ارائه میدهد که به توسعهدهندگان نرمافزار امکان استخراج متن از تصاویر را بهصورت آسان میدهد. Aspose.OCR برای پایتون از طریق .NET یک کتابخانه قدرتمند برای وظایف OCR است. این کتابخانه بخشی از مجموعه محصولات Aspose است که بهخاطر ارائه ابزارهای پردازش سند با کیفیت بالا شناخته شده است. این کتابخانه به توسعهدهندگان اجازه میدهد تا از قابلیتهای چارچوب .NET در حین برنامهنویسی با پایتون بهرهبرداری کنند و به این ترتیب برنامههای چندپلتفرمی که میتوانند عملیات OCR را بهصورت یکپارچه انجام دهند، فراهم میشود. این کتابخانه تشخیص متن را در بیش از ۱۰۰ زبان، از جمله انگلیسی، اسپانیایی، فرانسوی، آلمانی، ایتالیایی، چینی، ژاپنی و بسیاری دیگر پشتیبانی میکند.
Aspose.OCR برای پایتون از طریق .NET یک کتابخانه OCR مبتنی بر .NET است که به توسعهدهندگان امکان تشخیص و استخراج متن از فرمتهای مختلف تصویر، از جمله JPEG، PNG، GIF، BMP و TIFF را میدهد. این API از الگوریتمهای پیشرفته برای اطمینان از دقت بالا در تشخیص متن از فرمتهای مختلف تصویر استفاده میکند. این کتابخانه تشخیص متن در فونتها و سبکهای مختلف را پشتیبانی میکند. برای افزایش دقت تشخیص، Aspose.OCR قابلیتهای پیشپردازش مانند باینریسازی، اصلاح انحراف و حذف نویز را ارائه میدهد. این موارد به آمادهسازی تصاویر برای نتایج بهتر OCR کمک میکند. این کتابخانه میتواند چندین تصویر را در یک فرآیند مدیریت کند و پردازش دستهای را امکانپذیر سازد و در سناریوهایی که حجم زیادی از تصاویر باید پردازش شوند، زمان را صرفهجویی کند. با ویژگیهای پیشرفته خود، از جمله پشتیبانی چندزبانه، پیشپردازش تصویر، تحلیل چیدمان و مدیریت خطا، Aspose.OCR یک انتخاب ایدهآل برای توسعهدهندگان نرمافزار است که مایل به کار بر روی پروژههای مبتنی بر OCR هستند.
شروع کار با Aspose.OCR برای پایتون از طریق .NET
روش پیشنهادی برای نصب Aspose.OCR برای پایتون از طریق .NET استفاده از pip است. لطفاً برای نصب روان، فرمان زیر را استفاده کنید.
Install Aspose.OCR for Python via .NET via pip
pip install aspose-ocr-python-netمیتوانید SDK را مستقیماً از صفحه محصول Aspose.OCR Python Cloud SDK دانلود کنید.
عملیات OCR با دقت بالا با پایتون
Aspose.OCR برای پایتون از طریق .NET برای دقت و صحت بالا طراحی شده است. این کتابخانه مدلهای پیشرفته یادگیری ماشین را شامل میشود که دقت استخراج متن را حتی در تصاویر کج یا با وضوح پایین بهبود میبخشد. این ویژگی آن را برای برنامههایی که به تشخیص متن قابل اعتماد نیاز دارند، مانند استخراج خودکار دادهها از فرمها یا اسناد اسکنشده، مناسب میسازد. قطعه کد زیر یک پیادهسازی ساده را نشان میدهد که در آن یک تصویر بارگذاری، پردازش میشود و متن شناساییشده آن نمایش داده میشود.
چگونه تصاویر را بارگذاری، OCR انجام داده و متن را از طریق API پایتون استخراج کنیم؟
# Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
قابلیتهای پیشپردازش تصویر
کتابخانه Aspose.OCR برای پایتون از طریق .NET ویژگیهای قدرتمند پیشپردازش تصویر را در برنامههای پایتون ارائه میدهد. این ویژگیها دقت OCR را با اصلاح انحراف، حذف نویز و نرمالسازی تصویر بهبود میبخشند. این مراحل پیشپردازش هنگام کار با تصاویری که ممکن است تحت شرایط نامناسب اسکن شده باشند، حیاتی هستند. مثال زیر نشان میدهد که چگونه توسعهدهندگان میتوانند عملیات اصلاح انحراف را انجام دهند که تضمین میکند متن حتی اگر تصویر کمی کج یا بهطور کامل همراستا نباشد، بهدقت تشخیص داده شود.
چگونه عملیات OCR را با اصلاح انحراف در برنامههای پایتون انجام دهیم؟
from aspose.ocr import OcrEngine, SkewCorrection
ocr_engine = OcrEngine()
# Enable skew correction
ocr_engine.set_skew_correction(SkewCorrection.True)
ocr_engine.image = "skewed_image.png"
recognized_text = ocr_engine.get_text()
print("Corrected and Recognized Text:", recognized_text)
تشخیص متن دستنویس با پایتون
Aspose.OCR برای پایتون از طریق .NET بسیار آسان برای استفاده است و میتواند متن چاپی و دستنویس را تنها با چند خط کد پایتون تشخیص دهد. این ویژگی برای برنامههایی مانند دیجیتالیسازی یادداشتها یا امضاهای دستنویس بسیار مفید است. توانایی نرمافزار در تفسیر سبکهای مختلف متن، کاربرد آن را در حوزههایی مانند آموزش و مستندات قانونی افزایش میدهد. در ادامه مثالی آورده شده که نشان میدهد چگونه میتوان تشخیص متن دستنویس را با استفاده از کد پایتون انجام داد.
چگونه تشخیص متن دستنویس را با کتابخانه پایتون انجام دهیم؟
api = ocr.AsposeOcr()
''' add filters if you need '''
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
#filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.contrast_correction_filter())
''' initialize image collection and put images into it '''
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
input.add("Data\\OCR\\handwritten.jpg")
''' change recognition options if you need '''
settings = ocr.RecognitionSettings()
settings.detect_areas_mode=ocr.DetectAreasMode.PHOTO
''' run recognition '''
res = api.recognize_handwritten_text(input)
print(res[0].recognition_text)
منطقههای سفارشی تصویر OCR در برنامههای پایتون
Aspose.OCR برای پایتون از طریق .NET پشتیبانی کامل از تشخیص متن از ناحیه خاصی از یک تصویر در برنامههای پایتون را فراهم کرده است. توسعهدهندگان میتوانند نواحی خاصی را در یک تصویر برای OCR مشخص کنند که در سناریوهایی که تنها بخشی از تصویر حاوی متن مرتبط است، مفید است. توسعهدهندگان میتوانند نواحی سفارشی برای OCR بر روی تصویر تعریف کنند، حالتهای تشخیص را تنظیم کرده و پارامترهای دیگر را برای بهینهسازی فرآیند OCR بر اساس نیازهای خاص برنامه تنظیم نمایند. در ادامه مثالی آورده شده که نشان میدهد چگونه توسعهدهندگان میتوانند یک خط متن را تنها با چند خط کد پایتون تشخیص دهند.
چگونه یک خط متن را بر روی تصویر در برنامههای پایتون تشخیص دهیم؟
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)
