Aspose.OCR for Python via .NET

Прочетете и извлечете текст от изображения чрез Python API

Водещ мощен Python OCR API позволява на разработчиците да четат и извличат текст от изображения, снимки, екранни кадри, сканирани документи и PDF файлове.

В днешната дигитална ера конвертирането на изображения в редактиращи се текстови формати се превърна в съществена задача за много бизнеси и разработчици. Aspose.OCR for Python via .NET предоставя надеждно решение за оптично разпознаване на знаци (OCR), което позволява на софтуерните разработчици да извличат текст от изображения без усилие. Aspose.OCR for Python via .NET е мощна библиотека, предназначена за OCR задачи. Тя е част от пакета продукти Aspose, известен с предоставянето на висококачествени инструменти за обработка на документи. Тази библиотека позволява на разработчиците да използват възможностите на .NET рамката, докато кодират на Python, като по този начин се създават крос‑платформени приложения, способни безпроблемно да изпълняват OCR операции. Поддържа разпознаване на текст на над 100 езика, включително английски, испански, френски, немски, италиански, китайски, японски и много други.

Aspose.OCR for Python via .NET е .NET‑базирана OCR библиотека, която позволява на разработчиците да разпознават и извличат текст от различни формати на изображения, включително JPEG, PNG, GIF, BMP и TIFF. API‑то използва напреднали алгоритми, за да осигури висока точност при разпознаване на текст от различни формати. Поддържа разпознаване на текст в различни шрифтове и стилове. За подобряване на точността на разпознаването Aspose.OCR предлага възможности за предварителна обработка като бинаризация, изправяне и премахване на шум. Това помага за подготовка на изображенията за по‑добри OCR резултати. Може да обработва множество изображения в един процес, позволявайки пакетна обработка и спестявайки време в ситуации, където трябва да се обработват големи обеми от изображения. Със своите напреднали функции, включително поддръжка на множество езици, предварителна обработка на изображения, анализ на оформление и обработка на грешки, Aspose.OCR е идеален избор за софтуерни разработчици, желаещи да работят по OCR‑базирани проекти.

Общ преглед

Преглед на функциите на Aspose.OCR за Python чрез .NET.

Features Overview

Извършване на OCR
Добавяне на OCR възможности
Разпознаване на текст от изображение
Конвертиране на изображения с текст
Разпознат текст от шрифт
Търсене в PDF
27 езика за разпознаване
Създаване на OCR приложения
Запис в браузъра
Извличане на текст
Поддръжка на многопоточност

Features Overview

Разпознаване на завъртано изображение
Филтри за предварителна обработка
PDF към изображения
Разпознава китайски знаци
Открива популярни шрифтове
Обработва цялото изображение
Поддръжка на завъртени изображения
Групово разпознаване
Вграден проверка на правописа
Разделяне на PDF
PDF към Excel
PDF към SVG

Aspose.OCR for Python via .NET

API‑то главно поддържа PDF формат, но може да експортира PDF документи в редица други формати.

Четец

PDF, PDF/A, TEX, XPS, SVG

Записвач

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR for Python via .NET

Платформена независимост

Aspose.OCR за Python чрез .NET може да работи с всеки програмен език, базиран на Python.

Python 3.6 и по-нови.

Aspose.OCR for Python via .NET

Започнете с Aspose.OCR за Python чрез .NET

Препоръчителният начин за инсталиране на Aspose.OCR за Python чрез .NET е чрез pip. Моля, използвайте следната команда за безпроблемна инсталация.

Install Aspose.OCR for Python via .NET via pip

 pip install aspose-ocr-python-net

Можете да изтеглите SDK директно от Aspose.OCR Python Cloud SDK страница на продукта

OCR операции с висока точност чрез Python

Aspose.OCR за Python чрез .NET е проектирана за висока прецизност и точност. Библиотеката включва напреднали модели за машинно обучение, които подобряват точността на извличане на текст, дори при наклонени или нискокачествени изображения. Тази функция я прави подходяща за приложения, изискващи надеждно разпознаване на текст, като автоматизирано извличане на данни от сканирани формуляри или документи. Следният кодов откъс демонстрира проста имплементация, при която изображение се зарежда, обработва и разпознатият му текст се показва.

How to Load Images, Perform OCR and Extract Text via Python API?

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Възможности за предварителна обработка на изображения

Aspose.OCR за Python чрез .NET предоставя мощни функции за предварителна обработка на изображения в Python приложения. Тези функции подобряват точността на OCR, като корекция на наклон, премахване на шум и нормализация на изображението. Тези стъпки са от съществено значение, когато се работи с изображения, сканирани при неблагоприятни условия. Следният пример показва как разработчиците могат да извършат корекция на наклон, което гарантира, че текстът се разпознава точно, дори ако изображението е леко наклонено или не е перфектно подравнено.

Как да извършите OCR операция със корекция на наклон в Python приложения?

from aspose.ocr import OcrEngine, SkewCorrection

ocr_engine = OcrEngine()

# Enable skew correction
ocr_engine.set_skew_correction(SkewCorrection.True)

ocr_engine.image = "skewed_image.png"
recognized_text = ocr_engine.get_text()
print("Corrected and Recognized Text:", recognized_text)

Разпознаване на ръкописен текст чрез Python

Aspose.OCR за Python чрез .NET е много лесен за използване и може да разпознава както печатен, така и ръкописен текст с няколко реда Python код. Тази функция е изключително полезна за приложения като дигитализиране на ръкописни бележки или подписи. Способността на софтуера да интерпретира различни стилове на текст увеличава неговата полезност в сектори като образование и правна документация. По-долу е пример, който показва как да се извърши разпознаване на ръкописен текст с помощта на Python код.

Как да извършите разпознаване на ръкописен текст чрез Python библиотека?

api = ocr.AsposeOcr()

''' add filters if you need '''
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
#filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.contrast_correction_filter())

''' initialize image collection and put images into it '''
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
input.add("Data\\OCR\\handwritten.jpg")

''' change recognition options if you need '''
settings = ocr.RecognitionSettings()
settings.detect_areas_mode=ocr.DetectAreasMode.PHOTO

''' run recognition '''
res = api.recognize_handwritten_text(input)
print(res[0].recognition_text)

Персонализирани области на изображението за OCR в Python приложения

Aspose.OCR за Python чрез .NET предоставя пълна поддръжка за разпознаване на текст от конкретна област на изображението в Python приложения. Софтуерните разработчици могат да задават специфични региони в изображението за OCR, което е полезно в сценарии, където само част от изображението съдържа релевантен текст. Разработчиците могат да дефинират персонализирани региони за OCR върху изображение, да задават режими на разпознаване и да настройват други параметри за оптимизиране на процеса според специфичните изисквания на приложението. По-долу е пример, който показва как софтуерните разработчици могат да разпознаят един ред текст с няколко реда Python код.

Как да разпознаете един ред текст върху изображение чрез Python приложения?

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)