Безплатен API на Python за интегриране на OCR възможности и извличане на текст

API за OCR на Python с отворен код за точно и бързо разпознаване на текст от изображения и документи. Прочетете както текст от естествена сцена, така и плътен текст в документ с помощта на библиотеката на Python.

Технологията за оптично разпознаване на символи (OCR) съществува от известно време и се използва в различни отрасли за автоматизиране на задачи за въвеждане на данни и обработка на документи. EasyOCR е OCR (оптично разпознаване на знаци) двигател с отворен код, който е бърз, точен и лесен за използване. Той предоставя лесен за използване интерфейс за разработчиците да интегрират OCR в своите приложения. С библиотеката EasyOCR разработчиците на софтуер могат да извличат текст от изображения и сканирани документи за секунди, което я прави идеален инструмент за управление на документи, извличане на данни и автоматизация.

EasyOCR е написан на Python и се поддържа над 80+ езика, което го прави мощен инструмент за фирми, работещи в многоезични среди. Има няколко важни функции, които са част от библиотеката, като точно извличане на текст, многоезична поддръжка, проста интеграция със съществуващи приложения, персонализиране на OCR двигателя, за да отговори на вашите специфични нужди, рентабилни решения, извличане на текст от сканирани документи, получаване и съхранение извлечения текст и много други. API е базирано на облак решение, което не изисква инсталация на хардуер или софтуер, което го прави рентабилно решение за фирми от всякакъв размер.

EasyOCR API използва алгоритми за задълбочено обучение, за да постигне високи нива на точност и може бързо да обработва големи обеми данни. Това е гъвкаво и мащабируемо решение, което може да бъде интегрирано в съществуващи работни процеси с помощта на прост RESTful API. EasyOCR API е мощно OCR решение, което може да помогне на фирми от всякакъв размер да автоматизират своите процеси за въвеждане на данни, да подобрят точността и да намалят разходите. С поддръжка на множество езици, той е идеален инструмент за управление на документи, извличане на данни и автоматизация. Ако търсите OCR машина, която да интегрирате във вашето приложение, опитайте EasyOCR.

С един поглед

Общ преглед на функциите на EasyOCR.

Преглед на характеристиките

Извършване на OCR
Добавяне на възможности за OCR
Разпознаване на текст на изображение
Преобразувайте изображения на текст
Текст на разпознат шрифт
Търсене в PDF
Други езици
Създаване на OCR приложения
Запазване в браузър
Извличане на текст
Поддръжка на много нишки

EasyOCR

EasyOCR поддържа популярни файлови формати с изображения, изброени по-долу.

Читател

PNG, JPEG, BMP, TIFF, TGA, DICOM

Писател

PNG, JPEG, BMP, TIFF

EasyOCR

Независимост на платформата

EasyOCR може да работи с Python 2.7 и по-нова версия.

Python 2.7 и по-нова версия.

EasyOCR

Първи стъпки с EasyOCR

Препоръчителният начин за инсталиране на EasyOCR е използването на pip. Моля, използвайте следната команда за гладка инсталация.

Инсталирайте EasyOCR чрез pip

 pip install easyocr

Можете също да го инсталирате ръчно; изтеглете файловете с най-новата версия директно от хранилището на GitHub.

Четене на текст и извличане от изображение чрез API на Python

API EasyOCR с отворен код използва алгоритми за дълбоко обучение, за да зарежда, разпознава и извлича текст от изображения и PDF файлове в приложения на Python. EasyOCR може да чете няколко езика едновременно, но те трябва да са съвместими един с друг. Езиците, които споделят по-голямата част от знаците (напр. латиница) един с друг, са съвместими. API позволява четене и извличане на текст от изображения, включително как да се обработват предварително изображенията и да се коригират параметрите на OCR двигателя за подобряване на точността. Следващият пример показва как да четете и извличате текст от изображения и да автоматизирате задачите за въвеждане на данни с лекота.

Четене и извличане на текст от изображения чрез API на Python

import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine

# Load the image and preprocess it

from PIL import Image
import cv2

image = Image.open('text_image.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_image.png')

# Use the OCR engine to extract text from the image.

result = reader.readtext(image, detail=0)

Разпознаване на знаци от текстови полета чрез API на Python

Разпознаването на знаци от текстови полета е често срещан случай на използване на OCR машини. EasyOCR API с отворен код предоставя мощно и лесно за потребителя решение за този случай на употреба. Той помага на разработчиците на софтуер да разпознават знаците от текстовите полета с лекота и как да обработват предварително изображенията и да коригират параметрите на OCR машината, за да подобрят точността. Текстовите полета могат да имат различни форми, размери и ориентации и това може да повлияе на точността на OCR двигателя. Така че прилагането на някои стъпки за предварителна обработка може да подобри точността на OCR машината, като например Изместване на изображението, Прилагане на бинаризация и Прилагане на намаляване на шума.

Как да разпознавате знаци от текстови полета чрез API на Python?

import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine

# Load the image and preprocess it

from PIL import Image
import cv2

image = Image.open('text_box.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_box.png')

# OCR engine to recognize the characters in the text box

result = reader.readtext(image, detail=0)

# The result is a list of strings, where each string represents a recognized character in the text box.