1. Продукти
  2.   OCR
  3.   Python
  4.   PaddleOCR
 
  

API на Python с отворен код за интегриране на възможности за OCR

Python библиотека с отворен код, която позволява на разработчиците на софтуер лесно да интегрират възможности за оптично разпознаване на знаци (OCR) в техните приложения.

PaddleOCR е мощна библиотека на Python с отворен код, която позволява на разработчиците на софтуер лесно да интегрират възможностите за оптично разпознаване на знаци (OCR) в своите приложения на Python. Той е изграден върху PaddlePaddle, платформа за дълбоко обучение с отворен код, и използва най-съвременни модели за дълбоко обучение за постигане на висока точност и производителност. PaddleOCR опростява процеса на OCR, като предоставя API на високо ниво, който абстрахира много от детайлите на ниско ниво, което улеснява разработчиците да добавят възможности за OCR към своите приложения.

PaddleOCR предоставя пълна поддръжка за широк набор от езици и скриптове. В момента поддържа над 80 различни езика, включително арабски, китайски, английски, френски, немски, японски, корейски, руски, испански и много други. Това го прави ценен инструмент за разработчици, които трябва да работят с многоезично съдържание. В допълнение към своите мощни OCR възможности, библиотеката включва и редица полезни помощни програми за работа с изображения и текст. Например включва инструменти за предварителна обработка на изображения, като изкривяване и бинаризация, както и инструменти за последваща обработка за подобряване на точността на OCR изхода.

PaddleOCR предоставя няколко различни OCR модела, всеки оптимизиран за различни случаи на употреба. Например, моделът за разпознаване на текст се използва за локализиране и извличане на текстови региони от изображение, докато моделът за разпознаване на текст се използва за разпознаване на действителния текст в тези региони. Има и функция за съвкупност от модели, която позволява на разработчиците да комбинират множество модели, за да постигнат още по-висока точност. Като цяло, PaddleOCR е мощна и лесна за използване библиотека за добавяне на OCR възможности към вашите Python приложения. Неговата поддръжка за широка гама от езици и скриптове, както и неговите персонализирани модели и инструменти за последваща обработка, го правят ценен инструмент за разработчици, работещи с OCR.

Previous Next

Първи стъпки с PaddleOCR

Препоръчителният начин за инсталиране на PaddleOCR е използването на pip. Моля, използвайте следната команда за гладка инсталация

Инсталирайте PaddleOCR чрез pip

 

Install PaddleOCR via pip

 pip install paddleocr 

Можете също да го инсталирате ръчно; изтеглете файловете с най-новата версия директно от хранилището на GitHub.

Разпознаване на текст на изображение чрез API на PaddleOCR

Разпознаването на текст на изображение е процес на извличане на текст от изображения. Това е полезна техника за различни приложения като сканиране на документи, дигитализация и OCR (оптично разпознаване на символи). OCR (оптично разпознаване на знаци) API с отворен код предоставя набор от най-съвременни OCR модели, които могат да разпознават текст от различни изображения, включително сканирани документи, екранни снимки и снимки. Библиотеката поддържа няколко важни функции, свързани с разпознаването на текст на изображение, като зареждане на изображения, инициализиране на OCR модел, идентифициране на текстов регион в изображението, разпознаване на текст от изображението, извличане на текст от резултата и много други. Следващият пример показва как да разпознаете текст от изображение в приложения на Python.

Извършване на разпознаване на текст на изображение в проекти на Python

import paddleocr
ocr = paddleocr.OCR()

# load an image using the PIL
from PIL import Image

image = Image.open('example.jpg')
result = ocr.ocr(image)

# access the recognized text

for line in result:
    print(line[1][0])
    print(line[1][1])

OCR разпознаване на документи с помощта на Python API

Разпознаването на документи е една от забележителните изследователски области за OCR. Документите се използват почти всеки ден в нашия живот. Когато разработчиците на софтуер прилагат OCR към документ, той може да извлече важна информация, да извлече полета на формуляр, да анализира оформлението, да съхранява цифрово, а също и за четене на стари ръкописи. Библиотеката PaddleOCR с отворен код позволява на разработчиците на софтуер да зареждат различни видове документи, да извършват OCR операции и да разпознават и извличат текст от него с помощта на код на Python. Разпознаването на текст е много точно и библиотеката може лесно да разпознае точно специални знаци и интервали.

Извършване на OCR разпознаване на документиF чрез API на Python

img_path = './input_images/11-document-1.jpg'
result = ocr.ocr(img_path)

//Displaying the output.

Поддръжка за разпознаване на таблици в приложенията на Python

Библиотеката PaddleOCR с отворен код позволява на разработчиците на софтуер да разпознават данните от таблицата в своите Python приложения. Разпознаването на таблици съдържа основно три модела, едноредово разпознаване на текст-DB, едноредово разпознаване на текст-CRNN и структура на таблица, както и предсказване на клетъчни координати-SLANet. Следващият пример показва как да разпознаете изображението, което съдържа таблицата. Следващият пример показва как да използвате метода draw_ocr, който взема изображението, ограничителните полета, текстовете, резултатите и пътя към файла с шрифта. Връща изображение с ограничителните полета и открития текст. Можете да покажете изображението, като използвате метода за показване.

Заредете изображение и открийте текст в него чрез API на Python

from paddleocr import PaddleOCR, draw_ocr

# Load the image that contains the table.

# Load the image
img_path = 'table_image.png'
with open(img_path, 'rb') as f:
    img = f.read()

# Create an instance of the PaddleOCR object
ocr = PaddleOCR()


# Draw the bounding boxes around the detected table cells

boxes = [line[0] for line in result]
scores = [line[1] for line in result]
texts = [line[2][0] for line in result]
im_show = draw_ocr(img, boxes, texts, scores, font_path='arial.ttf')
im_show.show()

 Български