Aspose.OCR for Python via .NET

Чтение и извлечение текста из изображений через Python API

Ведущий мощный Python OCR API позволяет разработчикам читать и извлекать текст из изображений, фотографий, скриншотов, отсканированных документов и PDF‑файлов.

В современную цифровую эпоху преобразование изображений в редактируемые текстовые форматы стало важной задачей для многих компаний и разработчиков. Aspose.OCR for Python via .NET предоставляет надёжное решение для оптического распознавания символов (OCR), позволяющее разработчикам программного обеспечения без усилий извлекать текст из изображений. Aspose.OCR for Python via .NET — мощная библиотека, предназначенная для задач OCR. Она является частью набора продуктов Aspose, известного предоставлением высококачественных инструментов обработки документов. Эта библиотека позволяет разработчикам использовать возможности платформы .NET, программируя на Python, что обеспечивает кроссплатформенные приложения, способные бесшовно выполнять операции OCR. Она поддерживает распознавание текста более чем на 100 языках, включая английский, испанский, французский, немецкий, итальянский, китайский, японский и многие другие.

Aspose.OCR for Python via .NET — библиотека OCR на основе .NET, позволяющая разработчикам распознавать и извлекать текст из различных форматов изображений, включая JPEG, PNG, GIF, BMP и TIFF. API использует передовые алгоритмы, обеспечивая высокую точность распознавания текста из разных форматов изображений. Он поддерживает распознавание текста различными шрифтами и стилями. Для повышения точности распознавания Aspose.OCR предлагает возможности предобработки, такие как бинаризация, исправление наклона и удаление шума. Это помогает подготовить изображения для получения лучших результатов OCR. Он может обрабатывать несколько изображений в одном процессе, позволяя пакетную обработку и экономя время в сценариях, когда требуется обработать большие объёмы изображений. Благодаря расширенным функциям, включая поддержку нескольких языков, предобработку изображений, анализ макета и обработку ошибок, Aspose.OCR является идеальным выбором для разработчиков, желающих работать над проектами, основанными на OCR.

Обзор

Обзор возможностей Aspose.OCR for Python via .NET.

Features Overview

Выполнять OCR
Добавлять возможности OCR
Распознавать текст изображений
Преобразовывать изображения текста
Распознавать шрифтовый текст
Поиск в PDF
27 языков распознавания
Создавать OCR‑приложения
Сохранять в браузер
Извлекать текст
Поддержка многопоточности

Features Overview

Распознавать повернутые изображения
Фильтры предобработки
PDF в изображения
Распознает китайские символы
Обнаруживает популярные шрифты
Обрабатывает всё изображение
Поддержка повернутых изображений
Пакетное распознавание
Встроенный проверщик орфографии
Разделять PDF
PDF в Excel
PDF в SVG

Aspose.OCR for Python via .NET

API в основном поддерживает формат PDF, но может экспортировать PDF‑документы в ряд других форматов.

Читатель

PDF, PDF/A, TEX, XPS, SVG

Запись

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR for Python via .NET

Платформенная независимость

Aspose.OCR for Python via .NET может работать с любым языком программирования на основе Python.

Python 3.6 и выше.

Aspose.OCR for Python via .NET

Начало работы с Aspose.OCR for Python via .NET

Рекомендуемый способ установки Aspose.OCR for Python via .NET — использовать pip. Пожалуйста, выполните следующую команду для беспроблемной установки.

Install Aspose.OCR for Python via .NET via pip

 pip install aspose-ocr-python-net

Вы можете загрузить SDK напрямую со Aspose.OCR Python Cloud SDK product page

Операции OCR с высокой точностью через Python

Aspose.OCR for Python via .NET спроектирован для высокой точности и надёжности. Библиотека включает передовые модели машинного обучения, которые повышают точность извлечения текста, даже при работе с наклонёнными или низкокачественными изображениями. Эта функция делает её подходящей для приложений, требующих надёжного распознавания текста, таких как автоматическое извлечение данных из сканированных форм или документов. Ниже приведён простой пример кода, демонстрирующий загрузку изображения, его обработку и вывод распознанного текста.

Как загрузить изображения, выполнить OCR и извлечь текст через Python API?

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Возможности предобработки изображений

Aspose.OCR for Python via .NET предоставляет мощные функции предобработки изображений внутри Python‑приложений. Эти возможности повышают точность OCR, такие как коррекция наклона, удаление шума и нормализация изображения. Такие шаги предобработки особенно важны при работе с изображениями, отсканированными в неблагоприятных условиях. Ниже показан пример, как разработчики могут выполнить коррекцию наклона, обеспечивая точное обнаружение текста даже при небольшом наклоне или несоответствии изображения.

Как выполнить операцию OCR с коррекцией наклона в приложениях Python?

from aspose.ocr import OcrEngine, SkewCorrection

ocr_engine = OcrEngine()

# Enable skew correction
ocr_engine.set_skew_correction(SkewCorrection.True)

ocr_engine.image = "skewed_image.png"
recognized_text = ocr_engine.get_text()
print("Corrected and Recognized Text:", recognized_text)

Распознавание рукописного текста через Python

Aspose.OCR for Python via .NET очень прост в использовании и может распознавать как печатный, так и рукописный текст всего несколькими строками кода на Python. Эта функция особенно полезна для приложений, таких как оцифровка рукописных заметок или подписей. Способность программного обеспечения интерпретировать различные стили текста расширяет его полезность в таких сферах, как образование и юридическая документация. Ниже приведён пример, показывающий, как выполнить распознавание рукописного текста с помощью кода на Python.

Как выполнить распознавание рукописного текста с помощью библиотеки Python?

api = ocr.AsposeOcr()

''' add filters if you need '''
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
#filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.contrast_correction_filter())

''' initialize image collection and put images into it '''
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
input.add("Data\\OCR\\handwritten.jpg")

''' change recognition options if you need '''
settings = ocr.RecognitionSettings()
settings.detect_areas_mode=ocr.DetectAreasMode.PHOTO

''' run recognition '''
res = api.recognize_handwritten_text(input)
print(res[0].recognition_text)

Пользовательские области изображения OCR в приложениях Python

Aspose.OCR for Python via .NET предоставляет полную поддержку распознавания текста из определённой области изображения внутри Python‑приложений. Разработчики могут указывать конкретные области на изображении для OCR, что полезно в сценариях, когда только часть изображения содержит нужный текст. Разработчики могут задавать пользовательские области для OCR на изображении, устанавливать режимы распознавания и настраивать другие параметры для оптимизации процесса OCR в соответствии с требованиями конкретного приложения. Ниже показан пример, демонстрирующий, как разработчики могут распознать одну строку текста, используя всего несколько строк кода на Python.

Как распознать одну строку текста на изображении в приложениях Python?

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)