1. Táirgí
  2.   OCR
  3.   Python
  4.   MonkeyOCR
 
  

API Python Foinse Oscailte chun Aipeanna OCR Ciallmhara a Thógáil

API OCR Python Saor chun Téacs a Bhriathrú agus a Aithint ó Íomhánna, lena n-áirítear radhairc nádúrtha, foirmeacha, agus cáipéisí scanáilte laistigh de aipí Python.

Cad é MonkeyOCR?

Is córas Optúil Aithint Carachtar (OCR) casta, ó thús go deireadh, atá tógtha ar fhoghlaim dhomhain do fhorbróirí bogearraí a bhfuil réiteach cumhachtach agus solúbtha á lorg acu. Forbróirí ag Yuliang Liu, cuireann an leabharlann seo ar chumas brath agus aithint cruinn téacs ó fhoinsí éagsúla, lena n-áirítear radhairc nádúrtha, foirmeacha, agus cáipéisí scanáilte. Cuimsíonn a tharchur modúil agus inbhuanaithe teicnící foghlama dhomhain den scoth le píblíne innillithe láidir, rud a fhágann go bhfuil sé oiriúnach go háirithe do thascanna aithint téacs i ndomhain an tsaoil. Tá feidhmchláir phraiticiúla ó scanadh sonrasáin go léamh cártaí aitheantais go baint téacs as comharthaí agus ag tógáil píblíní OCR ilteangacha nó PDF-go-sonraí.

Deartha le solúbthacht uasta, cumasaíonn MonkeyOCR innealtóirí bogearraí córas próiseála cáipéisí cliste a chruthú gan brath ar innill OCR tráchtála. Tá raon leathan gnéithe casta aige, mar shampla píblíne OCR iomlán modúlach, cumraíocht simplí comhad YAML, agus tacaíocht innillithe i mbaisc éifeachtach. Soláthraíonn an córas aschuranna bosca téacs cruinn le comhordanáidí, ag baint úsáide as samhlacha nua-aimseartha mar DBNet++ le haghaidh brath agus CRNN le haghaidh aithint, uile laistigh de fhráma oibriúcháin réamh- agus iarscríbhinnte inchoigeartaithe. Cuireann an meascán seo de dhearadh modúlach, tacaíocht do mhúnlaí comhaimseartha, agus éascaíocht cumraíochta ar fáil, rud a fhágann go bhfuil MonkeyOCR foirfe le haghaidh tógála feidhmchlár casta, i ndomhain an tsaoil—ó uathoibriú cáipéisí fiontraí go aithint téacs radhairc ar ghléasanna soghluaiste.

Previous Next

Ag Tosú le MonkeyOCR

Is é an bealach molta chun MonkeyOCR a shuiteáil trí pip. Bain úsáid as an ordú seo a leanas le haghaidh suiteála réidh.

Suiteáil MonkeyOCR trí pip

 pip install MonkeyOCR 

Suiteáil MonkeyOCR trí GitHub

 git clone https://github.com/Yuliang-Liu/MonkeyOCR.git 

Is féidir leat é a shuiteáil de láimh freisin; íoslódáil na comhaid eisiúna is déanaí go díreach ón stór GitHub.

Baint Téacs ó Íomhá Receipt trí Python

Is córas Optúil Aithint Carachtar (OCR) casta, ó thús go deireadh, atá bunaithe ar theicnící foghlama dhomhain an cód foinse oscailte MonkeyOCR. Is féidir le Forbróirí Bogearraí a bhfuil ag forbairt aipeanna a scanann cáipéisí, cártaí aitheantais, receiptanna, nó plátaí ceadúnna an MonkeyOCR a ionchuradh go díreach i bpíblíne a gcúl. Leis an dearadh modúlach, is féidir leat an tsamhail bhrath amháin a úsáid nó í a chomhcheangail le haitheantas chun téacs struchtúrtha a bhaint as íomhánna. Seo sampla simplí a thaispeánann conas téacs a bhaint as íomhá receipt ag baint úsáide as an API Python.

Conas Téacs a Bhain ó Íomhá Receipt trí API Python?

from monkey_ocr.ocr_predict import OCRPredictor

ocr = OCRPredictor(det_model_path="weights/dbnet.pth", rec_model_path="weights/crnn.pth")
results = ocr.predict("receipt.jpg")

for line in results:
    print(line['text'])

Píblíní OCR Saincheaptha do Chásanna Úsáide Áirithe

Ceann de na láidreachtaí is mó de leabharlann MonkeyOCR foinse oscailte ná a tharchur modúlach. Is féidir le forbróirí bogearraí comhpháirteanna mar bhrath, aithint, agus samhlacha rangú a mheascadh de réir riachtanas a n‑aipí. Mar shampla, d'fhéadfadh aip scanadh cáipéisí samhail éadrom mar DBNet a úsáid le haghaidh brath agus CRNN le haghaidh aithint, ag uasmhéadú an luas agus an cruinneas araon.

Píblíní OCR Saincheaptha trí API Python?

from monkey_ocr.ocr_predict import OCRPredictor

ocr = OCRPredictor(
    det_model_path="weights/dbnet.pth",
    rec_model_path="weights/crnn.pth"
)

results = ocr.predict("form_image.jpg")
for item in results:
    print(item["text"], item["box"])

Comhtháthú le Bogearraí Gnó

Is féidir le leabharlann MonkeyOCR foinse oscailte a ionchuradh freisin i sreabhanna oibre doiciméad fiontraí, mar shampla uathoibriú iontrála sonraí i chórais ERP nó CRM. Is féidir le forbróirí bogearraí MonkeyOCR a rith sa chúlra chun PDFs scanáilte nó cáipéisí íomhá-bhunaithe a uaslódáil ó úsáideoirí, agus sonraí struchtúrtha a bhaint go huathoibríoch. Trí MonkeyOCR a chumrú le config.yaml, is féidir le foirne comhsheasmhacht a choimeád idir na socruithe éagsúla.

Tóg Léitheoirí Foirmeacha Uathoibríocha

Trí bhrath téacs MonkeyOCR a chomhcheangal le sonraí suímh (boscaí teorainn), is féidir le forbróirí léitheoirí foirmeacha cliste a dhearadh a aimseofar réimsí (m.sh. “Ainm”, “Dáta”, “Suim”) agus sonraí gaolmhar a bhaint as. Tá sé seo foirfe do cháipéisí cánach, foirmeacha leighis, nó suirbhéanna.

 Gaeilge