Bezmaksas Python API, lai integrētu OCR iespējas un izvilktu tekstu

Atvērtā pirmkoda Python OCR API precīzai un ātrai teksta atpazīšanai no attēliem un dokumentiem. Lasiet gan dabiskās ainas tekstu, gan blīvo tekstu dokumentā, izmantojot Python bibliotēku.

Optiskās rakstzīmju atpazīšanas (OCR) tehnoloģija pastāv jau kādu laiku, un to izmanto dažādās nozarēs, lai automatizētu datu ievades un dokumentu apstrādes uzdevumus. EasyOCR ir atvērtā koda OCR (optiskās rakstzīmju atpazīšanas) dzinējs, kas ir ātrs, precīzs un viegli lietojams. Tas nodrošina viegli lietojamu interfeisu izstrādātājiem, lai integrētu OCR savās lietojumprogrammās. Izmantojot EasyOCR bibliotēku, programmatūras izstrādātāji var dažu sekunžu laikā izvilkt tekstu no attēliem un skenētajiem dokumentiem, padarot to par ideālu rīku dokumentu pārvaldībai, datu ieguvei un automatizācijai.

EasyOCR ir rakstīts Python un atbalsta vairāk nekā 80 valodas, padarot to par jaudīgu rīku uzņēmumiem, kas darbojas daudzvalodu vidē. Bibliotēkas daļai ir vairākas svarīgas funkcijas, piemēram, precīza teksta izvilkšana, vairāku valodu atbalsts, vienkārša integrācija ar esošajām lietojumprogrammām, OCR dzinēja pielāgošana jūsu īpašajām vajadzībām, rentabli risinājumi, teksta izvilkšana no skenētajiem dokumentiem, saņemšana un uzglabāšana. izvilkto tekstu un daudz ko citu. API ir uz mākoņiem balstīts risinājums, kam nav nepieciešama aparatūras vai programmatūras instalēšana, tāpēc tas ir rentabls risinājums jebkura lieluma uzņēmumiem.

EasyOCR API izmanto dziļās mācīšanās algoritmus, lai sasniegtu augstu precizitātes līmeni, un tā var ātri apstrādāt lielu datu apjomu. Tas ir elastīgs un mērogojams risinājums, ko var integrēt esošajās darbplūsmās, izmantojot vienkāršu RESTful API. EasyOCR API ir spēcīgs OCR risinājums, kas var palīdzēt dažāda lieluma uzņēmumiem automatizēt datu ievades procesus, uzlabot precizitāti un samazināt izmaksas. Pateicoties vairāku valodu atbalstam, tas ir ideāls rīks dokumentu pārvaldībai, datu ieguvei un automatizācijai. Ja meklējat OCR programmu, ko integrēt savā lietojumprogrammā, izmēģiniet EasyOCR.

Īsumā

EasyOCR funkciju pārskats.

Funkcijas pārskats

Veikt OCR
Pievienojiet OCR iespējas
Atpazīt attēla tekstu
Teksta attēli
Atpazīts fonta teksts
Meklēt PDF failā
Citas valodas
Izveidojiet OCR lietotnes
Saglabāt pārlūkprogrammā
Izvilkt tekstu
Vairāku pavedienu atbalsts

EasyOCR

EasyOCR atbalsta tālāk norādītos populāros attēlu failu formātus.

Lasītājs

PNG, JPEG, BMP, TIFF, TGA, DICOM

rakstnieks

PNG, JPEG, BMP, TIFF

EasyOCR

Platformas neatkarība

EasyOCR var darboties ar Python 2.7 un jaunākām versijām.

Python 2.7 un jaunākas versijas.

EasyOCR

Darba sākšana ar EasyOCR

Ieteicamais EasyOCR instalēšanas veids ir pip izmantošana. Lūdzu, izmantojiet šo komandu vienmērīgai instalēšanai.

Instalējiet EasyOCR, izmantojot pip

 pip install easyocr

Varat to instalēt arī manuāli; lejupielādējiet jaunāko laidienu failus tieši no GitHub krātuves.

Teksta lasīšana un izvilkšana no attēla, izmantojot Python API

Atvērtā pirmkoda EasyOCR API izmanto dziļās mācīšanās algoritmus, lai ielādētu, atpazītu un izvilktu tekstu no attēliem un PDF failiem Python lietojumprogrammās. EasyOCR var vienlaikus lasīt vairākas valodas, taču tām ir jābūt saderīgām viena ar otru. Valodas, kurām ir lielāka daļa rakstzīmju (piemēram, latīņu rakstība), ir saderīgas. API ļauj nolasīt un izvilkt tekstu no attēliem, tostarp to, kā iepriekš apstrādāt attēlus un pielāgot OCR programmas parametrus, lai uzlabotu precizitāti. Šis piemērs parāda, kā viegli lasīt un izvilkt tekstu no attēliem un automatizēt datu ievades uzdevumus.

Lasiet un izvelciet tekstu no attēliem, izmantojot Python API

import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine

# Load the image and preprocess it

from PIL import Image
import cv2

image = Image.open('text_image.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_image.png')

# Use the OCR engine to extract text from the image.

result = reader.readtext(image, detail=0)

Tekstlodziņu rakstzīmju atpazīšana, izmantojot Python API

Tekstlodziņu rakstzīmju atpazīšana ir izplatīta OCR programmu izmantošanas iespēja. Atvērtā koda EasyOCR API nodrošina jaudīgu un lietotājam draudzīgu risinājumu šim lietošanas gadījumam. Tas palīdz programmatūras izstrādātājiem viegli atpazīt rakstzīmes no tekstlodziņiem un kā priekšapstrādāt attēlus un pielāgot OCR dzinēja parametrus, lai uzlabotu precizitāti. Tekstlodziņiem var būt dažādas formas, izmēri un orientācijas, un tas var ietekmēt OCR programmas precizitāti. Tāpēc, piemērojot dažas pirmapstrādes darbības, var uzlabot OCR programmas precizitāti, piemēram, attēla izkliedēšana, binarizācijas lietošana un trokšņu samazināšanas lietošana.

Kā atpazīt rakstzīmes no tekstlodziņu, izmantojot Python API?

import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine

# Load the image and preprocess it

from PIL import Image
import cv2

image = Image.open('text_box.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_box.png')

# OCR engine to recognize the characters in the text box

result = reader.readtext(image, detail=0)

# The result is a list of strings, where each string represents a recognized character in the text box.