1. Táirgí
  2.   OCR
  3.   Python
  4.   EasyOCR
 
  

API Python saor in aisce chun Cumais OCR a Chomhtháthú & Téacs a Bhaint

Foinse Oscailte Python OCR API le haghaidh Aitheantas Téacs Cruinn agus Tapa ó Íomhánna & Doiciméid. Léigh Téacs Radharc Nádúrtha agus Téacs Dlúth i ndoiciméad ag baint úsáide as Leabharlann Python.

Tá an teicneolaíocht um Aithint Optúil Carachtair (OCR) thart le tamall anuas, agus úsáidtear í i dtionscail éagsúla chun tascanna iontrála sonraí agus próiseála doiciméad a uathoibriú. Is inneall foinse oscailte OCR (Aithint Optúil Carachtair) é EasyOCR atá tapa, cruinn agus éasca le húsáid. Soláthraíonn sé comhéadan atá éasca le húsáid d’fhorbróirí chun OCR a chomhtháthú ina bhfeidhmchláir. Leis an leabharlann EasyOCR, is féidir le forbróirí bogearraí téacs a bhaint as íomhánna agus doiciméid scanta i gceann soicind, rud a fhágann gur uirlis iontach é le haghaidh bainistiú doiciméad, asbhaint sonraí agus uathoibriú.

Tá EasyOCR scríofa i Python agus tá tacaíocht aige do bhreis is 80+ teanga, rud a fhágann gur uirlis chumhachtach é do ghnólachtaí a oibríonn i dtimpeallachtaí ilteangacha. Tá roinnt gnéithe tábhachtacha mar chuid den leabharlann mar eastóscadh téacs cruinn, tacaíocht iltheanga, comhtháthú simplí le feidhmchláir atá ann cheana féin, an t-inneall OCR a shaincheapadh chun freastal ar do riachtanais shonracha, réitigh éifeachtacha ó thaobh costais, téacs a bhaint as doiciméid scanta, fáil & stóráil an téacs asbhainte, agus go leor eile. Is réiteach néalbhunaithe é an API nach dteastaíonn aon suiteáil crua-earraí nó bogearraí uaidh, rud a fhágann gur réiteach cost-éifeachtach é do ghnóthais de gach méid.

Úsáideann API EasyOCR algartaim dhomhainfhoghlama chun rátaí arda cruinnis a bhaint amach agus is féidir leis méideanna móra sonraí a phróiseáil go tapa. Is réiteach solúbtha agus inscálaithe é is féidir a chomhtháthú le sreabhadh oibre atá ann cheana féin ag baint úsáide as API RESTful simplí. Is réiteach cumhachtach OCR é EasyOCR API a chuidíonn le gnólachtaí de gach méid a bpróisis iontrála sonraí a uathoibriú, cruinneas a fheabhsú, agus costais a laghdú. Le tacaíocht d’iltheangacha, is uirlis iontach é do bhainistiú doiciméad, asbhaint sonraí agus uathoibriú. Má tá inneall OCR á lorg agat le comhtháthú isteach i d'fheidhmchlár, bain triail as EasyOCR.

Previous Next

Tús le EasyOCR

Is é an bealach molta chun EasyOCR a shuiteáil ná pip a úsáid. Bain úsáid as an ordú seo a leanas le haghaidh suiteáil rianúil.

Suiteáil EasyOCR trí pip

 pip install easyocr 

Is féidir leat é a shuiteáil de láimh freisin; íoslódáil na comhaid eisithe is déanaí go díreach ó GitHub stór.

Léamh Téacs & Baint as Íomhá trí Python API

Úsáideann an API foinse oscailte EasyOCR algartaim dhomhainfhoghlama chun téacs a luchtú, a aithint agus a bhaint as íomhánna agus comhaid PDF laistigh d’fheidhmchláir Python. Is féidir le EasyOCR iltheanga a léamh ag an am céanna ach caithfidh siad a bheith comhoiriúnach lena chéile. Tá teangacha a roinneann formhór na gcarachtar (m.sh. script Laidineach) comhoiriúnach lena chéile. Ceadaíonn an API téacs a léamh agus a bhaint as íomhánna, lena n-áirítear conas na híomhánna a réamhphróiseáil agus paraiméadair an innill OCR a choigeartú chun cruinneas a fheabhsú. Léiríonn an sampla seo a leanas conas téacs a léamh agus a bhaint as íomhánna agus tascanna iontrála sonraí a uathoibriú gan stró.

Léigh agus Bain Téacs ó Íomhánna trí Python API

import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine

# Load the image and preprocess it

from PIL import Image
import cv2

image = Image.open('text_image.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_image.png')

# Use the OCR engine to extract text from the image.

result = reader.readtext(image, detail=0)

Carachtair a Aithint as Boscaí Téacs trí Python API

Cás úsáide coitianta d’innill OCR is ea carachtair a aithint ó bhoscaí téacs. Soláthraíonn an API foinse oscailte EasyOCR réiteach cumhachtach agus éasca le húsáid ar an gcás úsáide seo. Cuidíonn sé le forbróirí bogearraí carachtair ó bhoscaí téacs a aithint gan stró agus conas na híomhánna a réamhphróiseáil agus paraiméadair an innill OCR a choigeartú chun cruinneas a fheabhsú. Is féidir cruthanna, méideanna agus treoshuímh éagsúla a bheith ag boscaí téacs, agus d’fhéadfadh tionchar a bheith aige seo ar chruinneas an innill OCR. Mar sin is féidir feabhas a chur ar chruinneas an innill OCR trí roinnt céimeanna réamhphróiseála a chur i bhfeidhm, mar shampla Deascabháil an íomhá, Cuir an dé-aonrú i bhfeidhm agus Cuir laghdú torainn i bhfeidhm.

Conas Carachtair ó Boscaí Téacs a Aithint trí Python API?

import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine

# Load the image and preprocess it

from PIL import Image
import cv2

image = Image.open('text_box.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_box.png')

# OCR engine to recognize the characters in the text box

result = reader.readtext(image, detail=0)

# The result is a list of strings, where each string represents a recognized character in the text box.

 Gaeilge