
Aspose.OCR for Python via .NET
Прочетете и извлечете текст от изображения чрез Python API
Водещ мощен Python OCR API позволява на разработчиците да четат и извличат текст от изображения, снимки, екранни кадри, сканирани документи и PDF файлове.
В днешната дигитална ера конвертирането на изображения в редактиращи се текстови формати се превърна в съществена задача за много бизнеси и разработчици. Aspose.OCR for Python via .NET предоставя надеждно решение за оптично разпознаване на знаци (OCR), което позволява на софтуерните разработчици да извличат текст от изображения без усилие. Aspose.OCR for Python via .NET е мощна библиотека, предназначена за OCR задачи. Тя е част от пакета продукти Aspose, известен с предоставянето на висококачествени инструменти за обработка на документи. Тази библиотека позволява на разработчиците да използват възможностите на .NET рамката, докато кодират на Python, като по този начин се създават крос‑платформени приложения, способни безпроблемно да изпълняват OCR операции. Поддържа разпознаване на текст на над 100 езика, включително английски, испански, френски, немски, италиански, китайски, японски и много други.
Aspose.OCR for Python via .NET е .NET‑базирана OCR библиотека, която позволява на разработчиците да разпознават и извличат текст от различни формати на изображения, включително JPEG, PNG, GIF, BMP и TIFF. API‑то използва напреднали алгоритми, за да осигури висока точност при разпознаване на текст от различни формати. Поддържа разпознаване на текст в различни шрифтове и стилове. За подобряване на точността на разпознаването Aspose.OCR предлага възможности за предварителна обработка като бинаризация, изправяне и премахване на шум. Това помага за подготовка на изображенията за по‑добри OCR резултати. Може да обработва множество изображения в един процес, позволявайки пакетна обработка и спестявайки време в ситуации, където трябва да се обработват големи обеми от изображения. Със своите напреднали функции, включително поддръжка на множество езици, предварителна обработка на изображения, анализ на оформление и обработка на грешки, Aspose.OCR е идеален избор за софтуерни разработчици, желаещи да работят по OCR‑базирани проекти.
Започнете с Aspose.OCR за Python чрез .NET
Препоръчителният начин за инсталиране на Aspose.OCR за Python чрез .NET е чрез pip. Моля, използвайте следната команда за безпроблемна инсталация.
Install Aspose.OCR for Python via .NET via pip
pip install aspose-ocr-python-netМожете да изтеглите SDK директно от Aspose.OCR Python Cloud SDK страница на продукта
OCR операции с висока точност чрез Python
Aspose.OCR за Python чрез .NET е проектирана за висока прецизност и точност. Библиотеката включва напреднали модели за машинно обучение, които подобряват точността на извличане на текст, дори при наклонени или нискокачествени изображения. Тази функция я прави подходяща за приложения, изискващи надеждно разпознаване на текст, като автоматизирано извличане на данни от сканирани формуляри или документи. Следният кодов откъс демонстрира проста имплементация, при която изображение се зарежда, обработва и разпознатият му текст се показва.
How to Load Images, Perform OCR and Extract Text via Python API?
# Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Възможности за предварителна обработка на изображения
Aspose.OCR за Python чрез .NET предоставя мощни функции за предварителна обработка на изображения в Python приложения. Тези функции подобряват точността на OCR, като корекция на наклон, премахване на шум и нормализация на изображението. Тези стъпки са от съществено значение, когато се работи с изображения, сканирани при неблагоприятни условия. Следният пример показва как разработчиците могат да извършат корекция на наклон, което гарантира, че текстът се разпознава точно, дори ако изображението е леко наклонено или не е перфектно подравнено.
Как да извършите OCR операция със корекция на наклон в Python приложения?
from aspose.ocr import OcrEngine, SkewCorrection
ocr_engine = OcrEngine()
# Enable skew correction
ocr_engine.set_skew_correction(SkewCorrection.True)
ocr_engine.image = "skewed_image.png"
recognized_text = ocr_engine.get_text()
print("Corrected and Recognized Text:", recognized_text)
Разпознаване на ръкописен текст чрез Python
Aspose.OCR за Python чрез .NET е много лесен за използване и може да разпознава както печатен, така и ръкописен текст с няколко реда Python код. Тази функция е изключително полезна за приложения като дигитализиране на ръкописни бележки или подписи. Способността на софтуера да интерпретира различни стилове на текст увеличава неговата полезност в сектори като образование и правна документация. По-долу е пример, който показва как да се извърши разпознаване на ръкописен текст с помощта на Python код.
Как да извършите разпознаване на ръкописен текст чрез Python библиотека?
api = ocr.AsposeOcr()
''' add filters if you need '''
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
#filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.contrast_correction_filter())
''' initialize image collection and put images into it '''
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
input.add("Data\\OCR\\handwritten.jpg")
''' change recognition options if you need '''
settings = ocr.RecognitionSettings()
settings.detect_areas_mode=ocr.DetectAreasMode.PHOTO
''' run recognition '''
res = api.recognize_handwritten_text(input)
print(res[0].recognition_text)
Персонализирани области на изображението за OCR в Python приложения
Aspose.OCR за Python чрез .NET предоставя пълна поддръжка за разпознаване на текст от конкретна област на изображението в Python приложения. Софтуерните разработчици могат да задават специфични региони в изображението за OCR, което е полезно в сценарии, където само част от изображението съдържа релевантен текст. Разработчиците могат да дефинират персонализирани региони за OCR върху изображение, да задават режими на разпознаване и да настройват други параметри за оптимизиране на процеса според специфичните изисквания на приложението. По-долу е пример, който показва как софтуерните разработчици могат да разпознаят един ред текст с няколко реда Python код.
Как да разпознаете един ред текст върху изображение чрез Python приложения?
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)
