Aspose.OCR for Python via .NET

Lasīt un izgūt tekstu no attēliem, izmantojot Python API

Vadošā jaudīgā Python OCR API ļauj izstrādātājiem lasīt un izgūt tekstu no attēliem, fotogrāfijām, ekrānuzņēmumiem, skenētiem dokumentiem un PDF failiem.

Šodienas digitālajā laikmetā attēlu pārveidošana rediģējamos teksta formātos ir kļuvusi par būtisku uzdevumu daudzām uzņēmējdarbībām un izstrādātājiem. Aspose.OCR for Python via .NET nodrošina izturīgu risinājumu optiskajai rakstzīmju atpazīšanai (OCR), kas ļauj programmatūras izstrādātājiem bez piepūles izgūt tekstu no attēliem. Aspose.OCR for Python via .NET ir jaudīga bibliotēka, kas paredzēta OCR uzdevumiem. Tā ir daļa no Aspose produktu sērijas, kas ir plaši pazīstama ar augstas kvalitātes dokumentu apstrādes rīkiem. Šī bibliotēka ļauj izstrādātājiem izmantot .NET ietvara iespējas, programmējot Python valodā, tādējādi ļaujot izveidot daudzplatformas lietojumprogrammas, kas var veikt OCR operācijas bez problēmām. Tā atbalsta teksta atpazīšanu vairāk nekā 100 valodās, tostarp angļu, spāņu, franču, vācu, itāļu, ķīniešu, japāņu un daudzās citās.

Aspose.OCR for Python via .NET ir .NET balstīta OCR bibliotēka, kas ļauj izstrādātājiem atpazīt un izgūt tekstu no dažādiem attēlu formātiem, tostarp JPEG, PNG, GIF, BMP un TIFF. API izmanto modernus algoritmus, lai nodrošinātu augstu precizitāti teksta atpazīšanā no dažādiem attēlu formātiem. Tā atbalsta teksta atpazīšanu dažādos fontos un stilos. Lai uzlabotu atpazīšanas precizitāti, Aspose.OCR piedāvā priekšapstrādes iespējas, piemēram, binarizāciju, slīpuma korekciju un trokšņa noņemšanu. Tas palīdz sagatavot attēlus labākiem OCR rezultātiem. Bibliotēka var apstrādāt vairākus attēlus vienā procesā, ļaujot veikt grupveida apstrādi un ietaupot laiku situācijās, kad jāapstrādā liels attēlu apjoms. Ar savām modernajām funkcijām, tostarp daudzvalodu atbalstu, attēlu priekšapstrādi, izkārtojuma analīzi un kļūdu apstrādi, Aspose.OCR ir ideāla izvēle programmatūras izstrādātājiem, kas vēlas strādāt pie OCR balstītiem projektiem.

Pārskats

Pārskats par Aspose.OCR for Python via .NET funkcijām.

Funkciju pārskats

Veikt OCR
Pievienot OCR iespējas
Atpazīt attēla tekstu
Pārvērst teksta attēlus
Atpazīts fonta teksts
Meklēt PDF
27 atpazīšanas valodas
Izveidot OCR lietotnes
Saglabāt pārlūkā
Izgūt tekstu
Daudzpavediena atbalsts

Funkciju pārskats

Atpazīt pagrieztu attēlu
Priekšapstrādes filtri
PDF uz attēliem
Atpazīt ķīniešu rakstzīmes
Noteikt populārus fontus
Apstrādā visu attēlu
Pagriezto attēlu atbalsts
Partijas atpazīšana
Iebūvētais pareizrakstības pārbaudītājs
Sadalīt PDF
PDF uz Excel
PDF uz SVG

Aspose.OCR for Python via .NET

API galvenokārt atbalsta PDF formātu, bet var eksportēt PDF dokumentus uz vairākiem citiem formātiem.

Lasītājs

PDF, PDF/A, TEX, XPS, SVG

Rakstītājs

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR for Python via .NET

Platformas neatkarība

Aspose.OCR for Python via .NET var darboties ar jebkuru uz Python balstītu programmēšanas valodu.

Python 3.6 un jaunāks.

Aspose.OCR for Python via .NET

Sākums ar Aspose.OCR for Python via .NET

Ieteicamais veids, kā instalēt Aspose.OCR for Python via .NET, ir izmantot pip. Lūdzu, izmantojiet šādu komandu, lai veiktu instalāciju.

Instalēt Aspose.OCR for Python via .NET, izmantojot pip

 pip install aspose-ocr-python-net

Jūs varat lejupielādēt SDK tieši no Aspose.OCR Python Cloud SDK produkta lapas

OCR operācijas ar augstu precizitāti, izmantojot Python

Aspose.OCR for Python via .NET ir izstrādāts, lai nodrošinātu augstu precizitāti un precizitāti. Bibliotēka ietver modernus mašīnmācīšanās modeļus, kas uzlabo teksta izguves precizitāti, pat ar slīpām vai zemas izšķirtspējas attēliem. Šī funkcija padara to piemērotu lietojumprogrammām, kurām ir nepieciešama uzticama teksta atpazīšana, piemēram, automatizētai datu izguvei no skenētiem anketām vai dokumentiem. Zemāk esošais koda fragments parāda vienkāršu īstenojumu, kur attēls tiek ielādēts, apstrādāts, un tā atpazītais teksts tiek parādīts.

Kā ielādēt attēlus, veikt OCR un izgūt tekstu, izmantojot Python API?

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Attēlu priekšapstrādes iespējas

Aspose.OCR for Python via .NET bibliotēka nodrošina jaudīgas attēlu priekšapstrādes iespējas Python lietojumprogrammās. Šīs iespējas uzlabo OCR precizitāti, piemēram, slīpuma korekciju, trokšņa noņemšanu un attēlu normalizāciju. Šie priekšapstrādes soļi ir būtiski, strādājot ar attēliem, kas var būt skenēti neideālos apstākļos. Zemāk esošais piemērs demonstrē, kā izstrādātāji var veikt slīpuma korekcijas operāciju, kas nodrošina, ka teksts tiek precīzi noteikts, pat ja attēls ir nedaudz slīps vai nav pilnīgi izlīdzināts.

Kā veikt OCR operāciju ar slīpuma korekciju Python lietojumprogrammās?

from aspose.ocr import OcrEngine, SkewCorrection

ocr_engine = OcrEngine()

# Enable skew correction
ocr_engine.set_skew_correction(SkewCorrection.True)

ocr_engine.image = "skewed_image.png"
recognized_text = ocr_engine.get_text()
print("Corrected and Recognized Text:", recognized_text)

Rokas rakstības teksta atpazīšana, izmantojot Python

Aspose.OCR for Python via .NET ir ļoti viegli lietojams un var atpazīt gan drukātu, gan rokraksta tekstu, izmantojot tikai dažas Python koda rindas. Šī funkcija ir ļoti noderīga lietojumprogrammām, piemēram, rokraksta piezīmju vai parakstu digitalizēšanai. Programmatūras spēja interpretēt dažādus teksta stilus palielina tās lietderību izglītības un juridiskās dokumentācijas nozarēs. Šeit ir piemērs, kas parāda, kā veikt rokraksta teksta atpazīšanu, izmantojot Python kodu.

Kā veikt rokas rakstības teksta atpazīšanu, izmantojot Python bibliotēku?

api = ocr.AsposeOcr()

''' add filters if you need '''
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
#filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.contrast_correction_filter())

''' initialize image collection and put images into it '''
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
input.add("Data\\OCR\\handwritten.jpg")

''' change recognition options if you need '''
settings = ocr.RecognitionSettings()
settings.detect_areas_mode=ocr.DetectAreasMode.PHOTO

''' run recognition '''
res = api.recognize_handwritten_text(input)
print(res[0].recognition_text)

OCR pielāgotas attēlu zonas Python lietojumprogrammās

Aspose.OCR for Python via .NET ir nodrošinājis pilnīgu atbalstu teksta atpazīšanai no konkrētas attēla zonas Python lietojumprogrammās. Programmatūras izstrādātāji var norādīt konkrētas zonas attēlā OCR vajadzībām, kas ir noderīgi situācijās, kad tikai attēla daļa satur būtisku tekstu. Izstrādātāji var definēt pielāgotas zonas attēlam, iestatīt atpazīšanas režīmus un pielāgot citus parametrus, lai optimizētu OCR procesu atbilstoši konkrētām lietojumprogrammas prasībām. Šeit ir piemērs, kas parāda, kā programmatūras izstrādātāji var atpazīt vienu teksta rindu, izmantojot tikai dažas Python koda rindas.

Kā atpazīt vienu teksta rindu attēlā, izmantojot Python lietojumprogrammas?

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)