1. Товары
  2.   OCR
  3.   Python
  4.   Aspose.OCR for Python via .NET

Aspose.OCR for Python via .NET

 
 

Чтение и извлечение текста из изображений через Python API

Ведущий мощный Python OCR API позволяет разработчикам читать и извлекать текст из изображений, фотографий, скриншотов, отсканированных документов и PDF‑файлов.

В современную цифровую эпоху преобразование изображений в редактируемые текстовые форматы стало важной задачей для многих компаний и разработчиков. Aspose.OCR for Python via .NET предоставляет надёжное решение для оптического распознавания символов (OCR), позволяющее разработчикам программного обеспечения без усилий извлекать текст из изображений. Aspose.OCR for Python via .NET — мощная библиотека, предназначенная для задач OCR. Она является частью набора продуктов Aspose, известного предоставлением высококачественных инструментов обработки документов. Эта библиотека позволяет разработчикам использовать возможности платформы .NET, программируя на Python, что обеспечивает кроссплатформенные приложения, способные бесшовно выполнять операции OCR. Она поддерживает распознавание текста более чем на 100 языках, включая английский, испанский, французский, немецкий, итальянский, китайский, японский и многие другие.

Aspose.OCR for Python via .NET — библиотека OCR на основе .NET, позволяющая разработчикам распознавать и извлекать текст из различных форматов изображений, включая JPEG, PNG, GIF, BMP и TIFF. API использует передовые алгоритмы, обеспечивая высокую точность распознавания текста из разных форматов изображений. Он поддерживает распознавание текста различными шрифтами и стилями. Для повышения точности распознавания Aspose.OCR предлагает возможности предобработки, такие как бинаризация, исправление наклона и удаление шума. Это помогает подготовить изображения для получения лучших результатов OCR. Он может обрабатывать несколько изображений в одном процессе, позволяя пакетную обработку и экономя время в сценариях, когда требуется обработать большие объёмы изображений. Благодаря расширенным функциям, включая поддержку нескольких языков, предобработку изображений, анализ макета и обработку ошибок, Aspose.OCR является идеальным выбором для разработчиков, желающих работать над проектами, основанными на OCR.

Previous Next

Начало работы с Aspose.OCR for Python via .NET

Рекомендуемый способ установки Aspose.OCR for Python via .NET — использовать pip. Пожалуйста, выполните следующую команду для беспроблемной установки.

Install Aspose.OCR for Python via .NET via pip

 pip install aspose-ocr-python-net

Вы можете загрузить SDK напрямую со Aspose.OCR Python Cloud SDK product page

Операции OCR с высокой точностью через Python

Aspose.OCR for Python via .NET спроектирован для высокой точности и надёжности. Библиотека включает передовые модели машинного обучения, которые повышают точность извлечения текста, даже при работе с наклонёнными или низкокачественными изображениями. Эта функция делает её подходящей для приложений, требующих надёжного распознавания текста, таких как автоматическое извлечение данных из сканированных форм или документов. Ниже приведён простой пример кода, демонстрирующий загрузку изображения, его обработку и вывод распознанного текста.

Как загрузить изображения, выполнить OCR и извлечь текст через Python API?

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Возможности предобработки изображений

Aspose.OCR for Python via .NET предоставляет мощные функции предобработки изображений внутри Python‑приложений. Эти возможности повышают точность OCR, такие как коррекция наклона, удаление шума и нормализация изображения. Такие шаги предобработки особенно важны при работе с изображениями, отсканированными в неблагоприятных условиях. Ниже показан пример, как разработчики могут выполнить коррекцию наклона, обеспечивая точное обнаружение текста даже при небольшом наклоне или несоответствии изображения.

Как выполнить операцию OCR с коррекцией наклона в приложениях Python?

from aspose.ocr import OcrEngine, SkewCorrection

ocr_engine = OcrEngine()

# Enable skew correction
ocr_engine.set_skew_correction(SkewCorrection.True)

ocr_engine.image = "skewed_image.png"
recognized_text = ocr_engine.get_text()
print("Corrected and Recognized Text:", recognized_text)

Распознавание рукописного текста через Python

Aspose.OCR for Python via .NET очень прост в использовании и может распознавать как печатный, так и рукописный текст всего несколькими строками кода на Python. Эта функция особенно полезна для приложений, таких как оцифровка рукописных заметок или подписей. Способность программного обеспечения интерпретировать различные стили текста расширяет его полезность в таких сферах, как образование и юридическая документация. Ниже приведён пример, показывающий, как выполнить распознавание рукописного текста с помощью кода на Python.

Как выполнить распознавание рукописного текста с помощью библиотеки Python?

api = ocr.AsposeOcr()

''' add filters if you need '''
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
#filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.contrast_correction_filter())

''' initialize image collection and put images into it '''
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
input.add("Data\\OCR\\handwritten.jpg")

''' change recognition options if you need '''
settings = ocr.RecognitionSettings()
settings.detect_areas_mode=ocr.DetectAreasMode.PHOTO

''' run recognition '''
res = api.recognize_handwritten_text(input)
print(res[0].recognition_text)

Пользовательские области изображения OCR в приложениях Python

Aspose.OCR for Python via .NET предоставляет полную поддержку распознавания текста из определённой области изображения внутри Python‑приложений. Разработчики могут указывать конкретные области на изображении для OCR, что полезно в сценариях, когда только часть изображения содержит нужный текст. Разработчики могут задавать пользовательские области для OCR на изображении, устанавливать режимы распознавания и настраивать другие параметры для оптимизации процесса OCR в соответствии с требованиями конкретного приложения. Ниже показан пример, демонстрирующий, как разработчики могут распознать одну строку текста, используя всего несколько строк кода на Python.

Как распознать одну строку текста на изображении в приложениях Python?

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)
 Русский