Nemokama Python API, skirta OCR galimybėms integruoti ir tekstui ištraukti
Atvirojo kodo Python OCR API, skirta tiksliam ir greitam teksto atpažinimui iš vaizdų ir dokumentų. Skaitykite ir natūralios scenos tekstą, ir tankų tekstą dokumente naudodami Python biblioteką.
Optinio simbolių atpažinimo (OCR) technologija egzistuoja jau kurį laiką ir naudojama įvairiose pramonės šakose automatizuoti duomenų įvedimo ir dokumentų apdorojimo užduotis. EasyOCR yra atviro kodo OCR (optinio simbolių atpažinimo) variklis, kuris yra greitas, tikslus ir paprastas naudoti. Tai suteikia kūrėjams lengvai naudojamą sąsają integruoti OCR į savo programas. Naudodami EasyOCR biblioteką programinės įrangos kūrėjai gali per kelias sekundes išgauti tekstą iš vaizdų ir nuskaitytų dokumentų, todėl tai yra ideali priemonė dokumentų valdymui, duomenų išgavimui ir automatizavimui.
EasyOCR parašyta Python ir palaikoma daugiau nei 80 kalbų, todėl tai yra galingas įrankis įmonėms, veikiančioms daugiakalbėje aplinkoje. Yra keletas svarbių bibliotekos funkcijų, tokių kaip tikslus teksto ištraukimas, kelių kalbų palaikymas, paprastas integravimas su esamomis programomis, OCR variklio pritaikymas, kad atitiktų jūsų konkrečius poreikius, ekonomiški sprendimai, teksto ištraukimas iš nuskaitytų dokumentų, gavimas ir saugojimas. ištrauktas tekstas ir daug daugiau. API yra debesies pagrindu sukurtas sprendimas, kuriam nereikia įdiegti jokios aparatinės ar programinės įrangos, todėl tai yra ekonomiškas sprendimas bet kokio dydžio įmonėms.
EasyOCR API naudoja gilaus mokymosi algoritmus, kad pasiektų aukštą tikslumo rodiklį ir gali greitai apdoroti didelius duomenų kiekius. Tai lankstus ir keičiamo dydžio sprendimas, kurį galima integruoti į esamas darbo eigas naudojant paprastą RESTful API. EasyOCR API yra galingas OCR sprendimas, galintis padėti įvairaus dydžio įmonėms automatizuoti duomenų įvedimo procesus, pagerinti tikslumą ir sumažinti išlaidas. Palaikantis kelias kalbas, tai idealus įrankis dokumentų valdymui, duomenų išgavimui ir automatizavimui. Jei ieškote OCR variklio, kurį būtų galima integruoti į programą, išbandykite EasyOCR.
Darbo su EasyOCR pradžia
Rekomenduojamas būdas įdiegti „EasyOCR“ yra naudoti pip. Norėdami sklandžiai įdiegti, naudokite šią komandą.
Įdiekite EasyOCR per pip
pip install easyocr
Taip pat galite įdiegti rankiniu būdu; atsisiųskite naujausius leidimo failus tiesiai iš GitHub saugyklos.
Teksto skaitymas ir ištraukimas iš vaizdo naudojant Python API
Atvirojo kodo EasyOCR API naudoja gilaus mokymosi algoritmus, kad įkeltų, atpažintų ir ištrauktų tekstą iš vaizdų ir PDF failų Python programose. „EasyOCR“ vienu metu gali skaityti keliomis kalbomis, tačiau jos turi būti suderinamos viena su kita. Kalbos, turinčios didžiąją dalį simbolių (pvz., lotyniškų rašmenų), yra suderinamos. API leidžia skaityti ir išgauti tekstą iš vaizdų, įskaitant išankstinį vaizdų apdorojimą ir OCR variklio parametrų reguliavimą, kad būtų padidintas tikslumas. Šiame pavyzdyje parodyta, kaip lengvai skaityti ir išgauti tekstą iš vaizdų ir automatizuoti duomenų įvedimo užduotis.
Skaitykite ir ištraukite tekstą iš vaizdų naudodami Python API
import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine
# Load the image and preprocess it
from PIL import Image
import cv2
image = Image.open('text_image.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_image.png')
# Use the OCR engine to extract text from the image.
result = reader.readtext(image, detail=0)
Simbolių atpažinimas iš teksto laukelių naudojant Python API
Simbolių atpažinimas iš teksto laukelių yra įprastas OCR variklių naudojimo atvejis. Atvirojo kodo „EasyOCR“ API suteikia galingą ir patogų sprendimą šiuo atveju. Tai padeda programinės įrangos kūrėjams lengvai atpažinti simbolius iš teksto laukelių ir kaip iš anksto apdoroti vaizdus bei koreguoti OCR variklio parametrus, kad būtų padidintas tikslumas. Teksto laukeliai gali būti skirtingų formų, dydžių ir orientacijų, o tai gali turėti įtakos OCR variklio tikslumui. Taigi pritaikius tam tikrus išankstinio apdorojimo veiksmus galima pagerinti OCR variklio tikslumą, pvz., iškreipti vaizdą, taikyti dvejetainį nustatymą ir taikyti triukšmo mažinimą.
Kaip atpažinti simbolius iš teksto laukelių naudojant Python API?
import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine
# Load the image and preprocess it
from PIL import Image
import cv2
image = Image.open('text_box.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_box.png')
# OCR engine to recognize the characters in the text box
result = reader.readtext(image, detail=0)
# The result is a list of strings, where each string represents a recognized character in the text box.