Aspose.OCR for Python via .NET

Read & Extract Text from Images via Python API

Leading Powerful Python OCR API allows Developers to Read and Extract Text from Images, Photos, Screenshots, Scanned Documents, and PDF Files.

Šiandieninėje skaitmeninėje eroje vaizdų konvertavimas į redaguojamus tekstinius formatus tapo svarbia užduotimi daugeliui įmonių ir kūrėjų. Aspose.OCR for Python via .NET suteikia patikimą sprendimą optiniam simbolių atpažinimui (OCR), leidžiantį programinės įrangos kūrėjams be vargo išgauti tekstą iš vaizdų. Aspose.OCR for Python via .NET yra galinga biblioteka, skirta OCR užduotims. Ji yra Aspose produktų šeimos dalis, garsėjanti aukštos kokybės dokumentų apdorojimo įrankiais. Ši biblioteka leidžia kūrėjams pasinaudoti .NET karkaso galimybėmis programuojant Python kalba, taip suteikdama galimybę kurti kryžminės platformos programas, galinčias sklandžiai atlikti OCR operacijas. Ji palaiko teksto atpažinimą daugiau nei 100 kalbų, įskaitant anglų, ispanų, prancūzų, vokiečių, italų, kinų, japonų ir daugelį kitų.

Aspose.OCR for Python via .NET yra .NET pagrindu veikianti OCR biblioteka, kuri leidžia kūrėjams atpažinti ir išgauti tekstą iš įvairių vaizdo formatų, įskaitant JPEG, PNG, GIF, BMP ir TIFF. API naudoja pažangius algoritmus, užtikrinančius aukštą teksto atpažinimo tikslumą įvairiuose vaizdo formatuose. Ji palaiko teksto atpažinimą skirtingais šriftais ir stiliais. Norint pagerinti atpažinimo tikslumą, Aspose.OCR siūlo išankstinio apdorojimo galimybes, tokias kaip binarizavimas, pasukimo korekcija ir triukšmo šalinimas. Tai padeda paruošti vaizdus geresniems OCR rezultatams. Biblioteka gali apdoroti kelis vaizdus vienu metu, leidžiant masinį apdorojimą ir sutaupyti laiką situacijose, kai reikia apdoroti didelį vaizdų kiekį. Su savo pažangiomis funkcijomis, įskaitant daugiakalbį palaikymą, vaizdo išankstinį apdorojimą, išdėstymo analizę ir klaidų tvarkymą, Aspose.OCR yra idealus pasirinkimas programinės įrangos kūrėjams, norintiems dirbti su OCR projektais.

Apžvalga

Apžvalga Aspose.OCR for Python via .NET funkcijų.

Funkcijų apžvalga

Atlikti OCR
Pridėti OCR galimybes
Atpažinti vaizdo tekstą
Konvertuoti teksto vaizdus
Atpažintas šrifto tekstas
Ieškoti PDF
27 atpažinimo kalbos
Kurti OCR programėles
Išsaugoti naršyklėje
Išgauti tekstą
Daugiašakės palaikymas

Funkcijų apžvalga

Atpažinti pasuką vaizdą
Išankstinio apdorojimo filtrai
PDF į vaizdus
Atpažįsta kinų simbolius
Aptinka populiarius šriftus
Apdoroja visą vaizdą
Pasuktų vaizdų palaikymas
Masinis atpažinimas
Įmontuota rašybos tikrinimo priemonė
Padalinti PDF
PDF į Excel
PDF į SVG

Aspose.OCR for Python via .NET

API pagrinde palaiko PDF formatą, tačiau gali eksportuoti PDF dokumentus į daugelį kitų formatų.

Skaitytojas

PDF, PDF/A, TEX, XPS, SVG

Rašytojas

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR for Python via .NET

Platformų nepriklausomumas

Aspose.OCR for Python via .NET gali veikti su bet kuria Python pagrindu sukurta programavimo kalba.

Python 3.6 ir aukštesnė versija.

Aspose.OCR for Python via .NET

Pradžia su Aspose.OCR for Python via .NET

Rekomenduojamas būdas įdiegti Aspose.OCR for Python via .NET yra naudojant pip. Prašome naudoti šią komandą sklandžiam įdiegimui.

Įdiegti Aspose.OCR for Python via .NET naudojant pip

 pip install aspose-ocr-python-net

SDK galite atsisiųsti tiesiai iš Aspose.OCR Python Cloud SDK produktų puslapio

OCR operacijos su dideliu tikslumu naudojant Python

Aspose.OCR for Python via .NET sukurta siekiant aukšto tikslumo ir preciziškumo. Biblioteka naudoja pažangius mašininio mokymosi modelius, kurie gerina teksto išgavimo tikslumą net ir pasvirusių ar žemos rezoliucijos vaizdų atveju. Ši funkcija tinka programoms, kurioms reikalingas patikimas teksto atpažinimas, pavyzdžiui, automatizuotam duomenų išgavimui iš nuskenuotų formų ar dokumentų. Žemiau pateiktas kodo fragmentas rodo paprastą įgyvendinimą, kai įkeliamas vaizdas, apdorojamas ir išvedamas atpažintas tekstas.

Kaip įkelti vaizdus, atlikti OCR ir išgauti tekstą naudojant Python API?

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Vaizdo išankstinio apdorojimo galimybės

Aspose.OCR for Python via .NET biblioteka suteikia galingas vaizdo išankstinio apdorojimo funkcijas Python programose. Šios funkcijos gerina OCR tikslumą, pvz., pasukimo korekcija, triukšmo šalinimas ir vaizdo normalizavimas. Šie išankstiniai žingsniai yra būtini dirbant su vaizdais, kurie gali būti nuskenuoti nepalankiomis sąlygomis. Žemiau pateiktas pavyzdys rodo, kaip kūrėjai gali atlikti pasukimo korekcijos operaciją, kuri užtikrina, kad tekstas būtų tiksliai aptiktas, net jei vaizdas šiek tiek pasukęs arba nevisiškai išlygintas.

Kaip atlikti OCR operaciją su pasukimo korekcija Python programose?

from aspose.ocr import OcrEngine, SkewCorrection

ocr_engine = OcrEngine()

# Enable skew correction
ocr_engine.set_skew_correction(SkewCorrection.True)

ocr_engine.image = "skewed_image.png"
recognized_text = ocr_engine.get_text()
print("Corrected and Recognized Text:", recognized_text)

Rankų rašymo teksto atpažinimas naudojant Python

Aspose.OCR for Python via .NET yra labai paprasta naudoti ir gali atpažinti tiek spausdintą, tiek ranka rašytą tekstą tik keliais Python kodo eilutėmis. Ši funkcija yra itin naudinga programoms, kurios skaitmenina ranka rašytas pastabas ar parašus. Programos gebėjimas interpretuoti įvairius teksto stilius padidina jos naudingumą švietimo ir teisinės dokumentacijos srityse. Žemiau pateiktas pavyzdys rodo, kaip atlikti ranka rašyto teksto atpažinimą naudojant Python kodą.

Kaip atlikti ranka rašyto teksto atpažinimą naudojant Python biblioteką?

api = ocr.AsposeOcr()

''' add filters if you need '''
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
#filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.contrast_correction_filter())

''' initialize image collection and put images into it '''
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
input.add("Data\\OCR\\handwritten.jpg")

''' change recognition options if you need '''
settings = ocr.RecognitionSettings()
settings.detect_areas_mode=ocr.DetectAreasMode.PHOTO

''' run recognition '''
res = api.recognize_handwritten_text(input)
print(res[0].recognition_text)

OCR pasirinktinių vaizdo regionų naudojimas Python programose

Aspose.OCR for Python via .NET suteikia pilną palaikymą teksto atpažinimui iš konkrečios vaizdo srities Python programose. Programinės įrangos kūrėjai gali nurodyti konkrečias sritis vaizde, kurias norima atpažinti, kas yra naudinga situacijose, kai tik dalis vaizdo turi reikšmingą tekstą. Kūrėjai gali apibrėžti pasirinktinius regionus OCR vaizde, nustatyti atpažinimo režimus ir koreguoti kitus parametrus, kad optimizuotų OCR procesą pagal konkrečius programos reikalavimus. Žemiau pateiktas pavyzdys rodo, kaip programinės įrangos kūrėjai gali atpažinti vieną teksto eilutę tik keliais Python kodo eilutėmis.

Kaip atpažinti vieną teksto eilutę vaizde naudojant Python programas?

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)