Open Source Python API chun Cumais OCR a Chomhtháthú
Leabharlann Python Foinse Oscailte a ligeann d'fhorbróirí bogearraí cumais aitheantais optúla carachtar (OCR) a chomhtháthú go héasca ina bhfeidhmchláir.
Is leabharlann chumhachtach foinse oscailte í PaddleOCR a chuireann ar chumas forbróirí bogearraí cumais optúla aitheantais carachtar (OCR) a chomhtháthú go héasca ina bhfeidhmchláir Python. Tá sé tógtha ar bharr PaddlePaddle, ardán foghlama domhain foinse oscailte, agus úsáideann sé samhlacha foghlama domhain den scoth chun ardchruinneas agus ardfheidhmíocht a bhaint amach. Déanann PaddleOCR an próiseas OCR a shimpliú trí API ardleibhéil a sholáthar a achoimríonn go leor de na sonraí ísealleibhéil, rud a fhágann go bhfuil sé éasca d'fhorbróirí cumais OCR a chur lena bhfeidhmchláir.
Chuir PaddleOCR tacaíocht iomlán ar fáil do raon leathan teangacha agus scripteanna. Faoi láthair tacaíonn sé le 80+ teangacha éagsúla, lena n-áirítear Araibis, Sínis, Béarla, Fraincis, Gearmáinis, Seapáinis, Cóiréis, Rúisis, Spáinnis, agus go leor eile. Déanann sé seo uirlis luachmhar d'fhorbróirí a bhfuil gá acu oibriú le hábhar ilteangach. Chomh maith lena chumais chumhachtacha OCR, áirítear sa leabharlann freisin roinnt fóntais úsáideacha chun oibriú le híomhánna agus téacs. Mar shampla, cuimsíonn sé uirlisí le haghaidh réamhphróiseáil íomhánna, amhail deasca agus dénártha, chomh maith le huirlisí iar-phróiseála chun cruinneas an aschuir OCR a fheabhsú.
Soláthraíonn PaddleOCR roinnt samhlacha OCR éagsúla, gach ceann acu optamaithe le haghaidh cásanna úsáide éagsúla. Mar shampla, úsáidtear an tsamhail Braite Téacs chun réigiúin téacs a aimsiú agus a bhaint as íomhá, agus úsáidtear an tsamhail Aithint Téacs chun an téacs iarbhír a aithint laistigh de na réigiúin sin. Tá gné Ensemble Samhail ann freisin a ligeann d’fhorbróirí samhlacha iolracha a chur le chéile chun cruinneas níos airde fós a bhaint amach. Tríd is tríd, is leabharlann chumhachtach agus éasca le húsáid é PaddleOCR chun cumais OCR a chur le d’fheidhmchláir Python. Is uirlis luachmhar é d'fhorbróirí a oibríonn le OCR mar gheall ar an tacaíocht a thugann sé do raon leathan teangacha agus scripteanna, chomh maith lena mhúnlaí inoiriúnaithe agus uirlisí iarphróiseála.
Tús le PaddleOCR
Is é an bealach molta chun PaddleOCR a shuiteáil ná pip a úsáid. Úsáid an t-ordú seo a leanas chun suiteáil mhín a dhéanamh
Suiteáil PaddleOCR trí pip
Install PaddleOCR via pip
pip install paddleocr
Is féidir leat é a shuiteáil de láimh freisin; íoslódáil na comhaid eisithe is déanaí go díreach ó GitHub stór.
Aithint Téacs Íomhá trí PaddleOCR API
Is éard is aitheantas téacs íomhá ann ná an próiseas chun téacs a bhaint as íomhánna. Is teicníocht úsáideach í le haghaidh feidhmeanna éagsúla cosúil le scanadh doiciméad, digitiú, agus OCR (Aithint Optúil Carachtair). Soláthraíonn an API foinse oscailte OCR (Aithint Carachtair Optúil) sraith samhlacha OCR den scoth ar féidir leo téacs a aithint ó íomhánna éagsúla, lena n-áirítear doiciméid scanta, scáileáin scáileáin agus grianghraif. Tacaíonn an leabharlann le roinnt gnéithe tábhachtacha a bhaineann le haitheantas téacs íomhá, mar shampla íomhánna a luchtú, samhail OCR a thionscnamh, réigiún téacs a aithint san íomhá, téacs a aithint ón íomhá, téacs a bhaint as an toradh, agus go leor eile. Taispeánann an sampla seo a leanas conas téacs a aithint ó íomhá taobh istigh d'fheidhmchláir Python.
Déan Aitheantas Téacs Íomhá laistigh de Thionscadail Python
import paddleocr
ocr = paddleocr.OCR()
# load an image using the PIL
from PIL import Image
image = Image.open('example.jpg')
result = ocr.ocr(image)
# access the recognized text
for line in result:
print(line[1][0])
print(line[1][1])
Aithint Doiciméad OCR ag úsáid Python API
Tá aitheantas doiciméad ar cheann de na réimsí taighde is suntasaí do OCR. Úsáidtear doiciméid beagnach gach lá dár saol. Nuair a chuireann forbróirí bogearraí OCR i bhfeidhm ar dhoiciméad, is féidir leo faisnéis thábhachtach a aisghabháil, réimsí foirmeacha a aisghabháil, anailís a dhéanamh ar leagan amach, stóráil go digiteach agus freisin chun seanlámhscríbhinní a léamh. Ligeann leabharlann foinse oscailte PaddleOCR d’fhorbróirí bogearraí cineálacha éagsúla doiciméad a luchtú, oibríochtaí OCR a dhéanamh agus téacs a aithint agus a bhaint aisti ag úsáid cód Python. Tá an t-aitheantas téacs an-chruinn agus is furasta sa leabharlann carachtair agus spásanna speisialta a bhrath go cruinn.
Déan Aitheantas Doiciméad OCRF ag úsáid Python API
img_path = './input_images/11-document-1.jpg'
result = ocr.ocr(img_path)
//Displaying the output.
Tacaíocht Aitheanta Tábla laistigh d'Aipeanna Python
Cuireann leabharlann foinse oscailte PaddleOCR ar chumas forbróirí bogearraí sonraí tábla a aithint laistigh dá bhfeidhmchláir Python. Cuimsíonn an t-aitheantas tábla go príomha trí mhúnla, braite téacs líne amháin-DB, aithint téacs líne singil-CRNN agus struchtúr tábla chomh maith le comhordanáidí cille tuar-SLANet. Taispeánann an sampla seo a leanas conas an íomhá atá sa tábla a aithint. Taispeánann an sampla seo a leanas conas an modh draw_ocr a úsáid a chuimsíonn an íomhá, na boscaí teorann, na téacsanna, na scóir, agus an cosán chuig an gclóchomhad. Filleann sé íomhá leis na boscaí teorann agus an téacs braite. Is féidir leat an íomhá a thaispeáint leis an modh taispeántais.
Lódáil Íomhá agus Braith Téacs istigh Inti trí Python API
from paddleocr import PaddleOCR, draw_ocr
# Load the image that contains the table.
# Load the image
img_path = 'table_image.png'
with open(img_path, 'rb') as f:
img = f.read()
# Create an instance of the PaddleOCR object
ocr = PaddleOCR()
# Draw the bounding boxes around the detected table cells
boxes = [line[0] for line in result]
scores = [line[1] for line in result]
texts = [line[2][0] for line in result]
im_show = draw_ocr(img, boxes, texts, scores, font_path='arial.ttf')
im_show.show()