Atvērtā pirmkoda Python API, lai integrētu OCR iespējas
Atvērtā pirmkoda Python bibliotēka, kas ļauj programmatūras izstrādātājiem savās lietojumprogrammās viegli integrēt optiskās rakstzīmju atpazīšanas (OCR) iespējas.
PaddleOCR ir jaudīga atvērtā pirmkoda Python bibliotēka, kas programmatūras izstrādātājiem ļauj viegli integrēt optiskās rakstzīmju atpazīšanas (OCR) iespējas savās Python lietojumprogrammās. Tā ir veidota, pamatojoties uz PaddlePaddle, atvērtā koda dziļās mācīšanās platformu, un tajā tiek izmantoti vismodernākie dziļās mācīšanās modeļi, lai sasniegtu augstu precizitāti un veiktspēju. PaddleOCR vienkāršo OCR procesu, nodrošinot augsta līmeņa API, kas abstrahē daudzas zema līmeņa detaļas, ļaujot izstrādātājiem viegli pievienot OCR iespējas savām lietojumprogrammām.
PaddleOCR ir nodrošinājis pilnīgu atbalstu plašam valodu un skriptu klāstam. Pašlaik tas atbalsta vairāk nekā 80 dažādas valodas, tostarp arābu, ķīniešu, angļu, franču, vācu, japāņu, korejiešu, krievu, spāņu un daudzas citas. Tas padara to par vērtīgu rīku izstrādātājiem, kuriem nepieciešams strādāt ar daudzvalodu saturu. Papildus jaudīgajām OCR iespējām bibliotēkā ir arī vairākas noderīgas utilītas darbam ar attēliem un tekstu. Piemēram, tajā ir iekļauti rīki attēlu pirmapstrādei, piemēram, izkliedēšana un binarizācija, kā arī pēcapstrādes rīki OCR izvades precizitātes uzlabošanai.
PaddleOCR nodrošina vairākus dažādus OCR modeļus, no kuriem katrs ir optimizēts dažādiem lietošanas gadījumiem. Piemēram, teksta noteikšanas modelis tiek izmantots teksta apgabalu atrašanai un izvilkšanai no attēla, savukārt teksta atpazīšanas modelis tiek izmantots faktiskā teksta atpazīšanai šajos reģionos. Ir arī Model Ensemble funkcija, kas ļauj izstrādātājiem apvienot vairākus modeļus, lai sasniegtu vēl lielāku precizitāti. Kopumā PaddleOCR ir jaudīga un viegli lietojama bibliotēka OCR iespēju pievienošanai jūsu Python lietojumprogrammām. Tā atbalsts plašam valodu un skriptu klāstam, kā arī pielāgojamie modeļi un pēcapstrādes rīki padara to par vērtīgu rīku izstrādātājiem, kas strādā ar OCR.
Darba sākšana ar PaddleOCR
Ieteicamais PaddleOCR instalēšanas veids ir pip izmantošana. Lūdzu, izmantojiet šo komandu vienmērīgai instalēšanai
Instalējiet PaddleOCR, izmantojot pip
Instalējiet PaddleOCR, izmantojot pip
pip install paddleocr
Varat to instalēt arī manuāli; lejupielādējiet jaunāko laidienu failus tieši no GitHub krātuves.
Attēla teksta atpazīšana, izmantojot PaddleOCR API
Attēla teksta atpazīšana ir teksta izvilkšanas process no attēliem. Tas ir noderīgs paņēmiens dažādām lietojumprogrammām, piemēram, dokumentu skenēšanai, digitalizācijai un OCR (optiskā rakstzīmju atpazīšana). Atvērtā koda OCR (Optical Character Recognition) API nodrošina mūsdienīgu OCR modeļu kopu, kas var atpazīt tekstu no dažādiem attēliem, tostarp skenētiem dokumentiem, ekrānuzņēmumiem un fotogrāfijām. Bibliotēka atbalsta vairākas svarīgas funkcijas, kas saistītas ar attēla teksta atpazīšanu, piemēram, attēlu ielādi, OCR modeļa inicializāciju, teksta reģiona identificēšanu attēlā, teksta atpazīšanu no attēla, teksta izvilkšanu no rezultāta un daudz ko citu. Šis piemērs parāda, kā atpazīt tekstu no attēla Python lietojumprogrammās.
Python projektos veiciet attēla teksta atpazīšanu
import paddleocr
ocr = paddleocr.OCR()
# load an image using the PIL
from PIL import Image
image = Image.open('example.jpg')
result = ocr.ocr(image)
# access the recognized text
for line in result:
print(line[1][0])
print(line[1][1])
OCR dokumentu atpazīšana, izmantojot Python API
Dokumentu atpazīšana ir bijusi viena no ievērojamākajām OCR pētniecības jomām. Dokumenti tiek izmantoti gandrīz katru dienu mūsu dzīvē. Kad programmatūras izstrādātāji dokumentam izmanto OCR, tas var izgūt svarīgu informāciju, izgūt veidlapas laukus, analizēt izkārtojumu, uzglabāt digitāli un arī lasīt vecus manuskriptus. Atvērtā pirmkoda PaddleOCR bibliotēka ļauj programmatūras izstrādātājiem ielādēt dažāda veida dokumentus, veikt OCR darbības un atpazīt un izvilkt no tā tekstu, izmantojot Python kodu. Teksta atpazīšana ir ļoti precīza, un bibliotēka var viegli precīzi noteikt īpašās rakstzīmes un atstarpes.
Veikt OCR dokumentu atpazīšanuF, izmantojot Python API
img_path = './input_images/11-document-1.jpg'
result = ocr.ocr(img_path)
//Displaying the output.
Tabulu atpazīšanas atbalsts Python lietotnēs
Atvērtā pirmkoda PaddleOCR bibliotēka ļauj programmatūras izstrādātājiem atpazīt tabulu datus savās Python lietojumprogrammās. Tabulas atpazīšana galvenokārt satur trīs modeļus, vienas rindiņas teksta noteikšanas DB, vienas rindiņas teksta atpazīšanas CRNN un tabulas struktūru, kā arī šūnu koordinātu prognozēšanu SLANet. Nākamajā piemērā parādīts, kā atpazīt attēlu, kurā ir tabula. Nākamajā piemērā parādīts, kā izmantot metodi draw_ocr, kas ņem attēlu, ierobežojošos lodziņus, tekstus, punktu skaitu un ceļu uz fonta failu. Tas atgriež attēlu ar ierobežojošajiem lodziņiem un atklāto tekstu. Varat parādīt attēlu, izmantojot rādīšanas metodi.
Ielādējiet attēlu un atrodiet tajā tekstu, izmantojot Python API
from paddleocr import PaddleOCR, draw_ocr
# Load the image that contains the table.
# Load the image
img_path = 'table_image.png'
with open(img_path, 'rb') as f:
img = f.read()
# Create an instance of the PaddleOCR object
ocr = PaddleOCR()
# Draw the bounding boxes around the detected table cells
boxes = [line[0] for line in result]
scores = [line[1] for line in result]
texts = [line[2][0] for line in result]
im_show = draw_ocr(img, boxes, texts, scores, font_path='arial.ttf')
im_show.show()