API Python saor in aisce chun Cumais OCR a Chomhtháthú & Téacs a Bhaint
Foinse Oscailte Python OCR API le haghaidh Aitheantas Téacs Cruinn agus Tapa ó Íomhánna & Doiciméid. Léigh Téacs Radharc Nádúrtha agus Téacs Dlúth i ndoiciméad ag baint úsáide as Leabharlann Python.
Tá an teicneolaíocht um Aithint Optúil Carachtair (OCR) thart le tamall anuas, agus úsáidtear í i dtionscail éagsúla chun tascanna iontrála sonraí agus próiseála doiciméad a uathoibriú. Is inneall foinse oscailte OCR (Aithint Optúil Carachtair) é EasyOCR atá tapa, cruinn agus éasca le húsáid. Soláthraíonn sé comhéadan atá éasca le húsáid d’fhorbróirí chun OCR a chomhtháthú ina bhfeidhmchláir. Leis an leabharlann EasyOCR, is féidir le forbróirí bogearraí téacs a bhaint as íomhánna agus doiciméid scanta i gceann soicind, rud a fhágann gur uirlis iontach é le haghaidh bainistiú doiciméad, asbhaint sonraí agus uathoibriú.
Tá EasyOCR scríofa i Python agus tá tacaíocht aige do bhreis is 80+ teanga, rud a fhágann gur uirlis chumhachtach é do ghnólachtaí a oibríonn i dtimpeallachtaí ilteangacha. Tá roinnt gnéithe tábhachtacha mar chuid den leabharlann mar eastóscadh téacs cruinn, tacaíocht iltheanga, comhtháthú simplí le feidhmchláir atá ann cheana féin, an t-inneall OCR a shaincheapadh chun freastal ar do riachtanais shonracha, réitigh éifeachtacha ó thaobh costais, téacs a bhaint as doiciméid scanta, fáil & stóráil an téacs asbhainte, agus go leor eile. Is réiteach néalbhunaithe é an API nach dteastaíonn aon suiteáil crua-earraí nó bogearraí uaidh, rud a fhágann gur réiteach cost-éifeachtach é do ghnóthais de gach méid.
Úsáideann API EasyOCR algartaim dhomhainfhoghlama chun rátaí arda cruinnis a bhaint amach agus is féidir leis méideanna móra sonraí a phróiseáil go tapa. Is réiteach solúbtha agus inscálaithe é is féidir a chomhtháthú le sreabhadh oibre atá ann cheana féin ag baint úsáide as API RESTful simplí. Is réiteach cumhachtach OCR é EasyOCR API a chuidíonn le gnólachtaí de gach méid a bpróisis iontrála sonraí a uathoibriú, cruinneas a fheabhsú, agus costais a laghdú. Le tacaíocht d’iltheangacha, is uirlis iontach é do bhainistiú doiciméad, asbhaint sonraí agus uathoibriú. Má tá inneall OCR á lorg agat le comhtháthú isteach i d'fheidhmchlár, bain triail as EasyOCR.
Tús le EasyOCR
Is é an bealach molta chun EasyOCR a shuiteáil ná pip a úsáid. Bain úsáid as an ordú seo a leanas le haghaidh suiteáil rianúil.
Suiteáil EasyOCR trí pip
pip install easyocr
Is féidir leat é a shuiteáil de láimh freisin; íoslódáil na comhaid eisithe is déanaí go díreach ó GitHub stór.
Léamh Téacs & Baint as Íomhá trí Python API
Úsáideann an API foinse oscailte EasyOCR algartaim dhomhainfhoghlama chun téacs a luchtú, a aithint agus a bhaint as íomhánna agus comhaid PDF laistigh d’fheidhmchláir Python. Is féidir le EasyOCR iltheanga a léamh ag an am céanna ach caithfidh siad a bheith comhoiriúnach lena chéile. Tá teangacha a roinneann formhór na gcarachtar (m.sh. script Laidineach) comhoiriúnach lena chéile. Ceadaíonn an API téacs a léamh agus a bhaint as íomhánna, lena n-áirítear conas na híomhánna a réamhphróiseáil agus paraiméadair an innill OCR a choigeartú chun cruinneas a fheabhsú. Léiríonn an sampla seo a leanas conas téacs a léamh agus a bhaint as íomhánna agus tascanna iontrála sonraí a uathoibriú gan stró.
Léigh agus Bain Téacs ó Íomhánna trí Python API
import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine
# Load the image and preprocess it
from PIL import Image
import cv2
image = Image.open('text_image.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_image.png')
# Use the OCR engine to extract text from the image.
result = reader.readtext(image, detail=0)
Carachtair a Aithint as Boscaí Téacs trí Python API
Cás úsáide coitianta d’innill OCR is ea carachtair a aithint ó bhoscaí téacs. Soláthraíonn an API foinse oscailte EasyOCR réiteach cumhachtach agus éasca le húsáid ar an gcás úsáide seo. Cuidíonn sé le forbróirí bogearraí carachtair ó bhoscaí téacs a aithint gan stró agus conas na híomhánna a réamhphróiseáil agus paraiméadair an innill OCR a choigeartú chun cruinneas a fheabhsú. Is féidir cruthanna, méideanna agus treoshuímh éagsúla a bheith ag boscaí téacs, agus d’fhéadfadh tionchar a bheith aige seo ar chruinneas an innill OCR. Mar sin is féidir feabhas a chur ar chruinneas an innill OCR trí roinnt céimeanna réamhphróiseála a chur i bhfeidhm, mar shampla Deascabháil an íomhá, Cuir an dé-aonrú i bhfeidhm agus Cuir laghdú torainn i bhfeidhm.
Conas Carachtair ó Boscaí Téacs a Aithint trí Python API?
import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine
# Load the image and preprocess it
from PIL import Image
import cv2
image = Image.open('text_box.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_box.png')
# OCR engine to recognize the characters in the text box
result = reader.readtext(image, detail=0)
# The result is a list of strings, where each string represents a recognized character in the text box.