
Aspose.OCR for Python via .NET
Read & Extract Text from Images via Python API
Leading Powerful Python OCR API allows Developers to Read and Extract Text from Images, Photos, Screenshots, Scanned Documents, and PDF Files.
Šiandieninėje skaitmeninėje eroje vaizdų konvertavimas į redaguojamus tekstinius formatus tapo svarbia užduotimi daugeliui įmonių ir kūrėjų. Aspose.OCR for Python via .NET suteikia patikimą sprendimą optiniam simbolių atpažinimui (OCR), leidžiantį programinės įrangos kūrėjams be vargo išgauti tekstą iš vaizdų. Aspose.OCR for Python via .NET yra galinga biblioteka, skirta OCR užduotims. Ji yra Aspose produktų šeimos dalis, garsėjanti aukštos kokybės dokumentų apdorojimo įrankiais. Ši biblioteka leidžia kūrėjams pasinaudoti .NET karkaso galimybėmis programuojant Python kalba, taip suteikdama galimybę kurti kryžminės platformos programas, galinčias sklandžiai atlikti OCR operacijas. Ji palaiko teksto atpažinimą daugiau nei 100 kalbų, įskaitant anglų, ispanų, prancūzų, vokiečių, italų, kinų, japonų ir daugelį kitų.
Aspose.OCR for Python via .NET yra .NET pagrindu veikianti OCR biblioteka, kuri leidžia kūrėjams atpažinti ir išgauti tekstą iš įvairių vaizdo formatų, įskaitant JPEG, PNG, GIF, BMP ir TIFF. API naudoja pažangius algoritmus, užtikrinančius aukštą teksto atpažinimo tikslumą įvairiuose vaizdo formatuose. Ji palaiko teksto atpažinimą skirtingais šriftais ir stiliais. Norint pagerinti atpažinimo tikslumą, Aspose.OCR siūlo išankstinio apdorojimo galimybes, tokias kaip binarizavimas, pasukimo korekcija ir triukšmo šalinimas. Tai padeda paruošti vaizdus geresniems OCR rezultatams. Biblioteka gali apdoroti kelis vaizdus vienu metu, leidžiant masinį apdorojimą ir sutaupyti laiką situacijose, kai reikia apdoroti didelį vaizdų kiekį. Su savo pažangiomis funkcijomis, įskaitant daugiakalbį palaikymą, vaizdo išankstinį apdorojimą, išdėstymo analizę ir klaidų tvarkymą, Aspose.OCR yra idealus pasirinkimas programinės įrangos kūrėjams, norintiems dirbti su OCR projektais.
Pradžia su Aspose.OCR for Python via .NET
Rekomenduojamas būdas įdiegti Aspose.OCR for Python via .NET yra naudojant pip. Prašome naudoti šią komandą sklandžiam įdiegimui.
Įdiegti Aspose.OCR for Python via .NET naudojant pip
pip install aspose-ocr-python-netSDK galite atsisiųsti tiesiai iš Aspose.OCR Python Cloud SDK produktų puslapio
OCR operacijos su dideliu tikslumu naudojant Python
Aspose.OCR for Python via .NET sukurta siekiant aukšto tikslumo ir preciziškumo. Biblioteka naudoja pažangius mašininio mokymosi modelius, kurie gerina teksto išgavimo tikslumą net ir pasvirusių ar žemos rezoliucijos vaizdų atveju. Ši funkcija tinka programoms, kurioms reikalingas patikimas teksto atpažinimas, pavyzdžiui, automatizuotam duomenų išgavimui iš nuskenuotų formų ar dokumentų. Žemiau pateiktas kodo fragmentas rodo paprastą įgyvendinimą, kai įkeliamas vaizdas, apdorojamas ir išvedamas atpažintas tekstas.
Kaip įkelti vaizdus, atlikti OCR ir išgauti tekstą naudojant Python API?
# Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Vaizdo išankstinio apdorojimo galimybės
Aspose.OCR for Python via .NET biblioteka suteikia galingas vaizdo išankstinio apdorojimo funkcijas Python programose. Šios funkcijos gerina OCR tikslumą, pvz., pasukimo korekcija, triukšmo šalinimas ir vaizdo normalizavimas. Šie išankstiniai žingsniai yra būtini dirbant su vaizdais, kurie gali būti nuskenuoti nepalankiomis sąlygomis. Žemiau pateiktas pavyzdys rodo, kaip kūrėjai gali atlikti pasukimo korekcijos operaciją, kuri užtikrina, kad tekstas būtų tiksliai aptiktas, net jei vaizdas šiek tiek pasukęs arba nevisiškai išlygintas.
Kaip atlikti OCR operaciją su pasukimo korekcija Python programose?
from aspose.ocr import OcrEngine, SkewCorrection
ocr_engine = OcrEngine()
# Enable skew correction
ocr_engine.set_skew_correction(SkewCorrection.True)
ocr_engine.image = "skewed_image.png"
recognized_text = ocr_engine.get_text()
print("Corrected and Recognized Text:", recognized_text)
Rankų rašymo teksto atpažinimas naudojant Python
Aspose.OCR for Python via .NET yra labai paprasta naudoti ir gali atpažinti tiek spausdintą, tiek ranka rašytą tekstą tik keliais Python kodo eilutėmis. Ši funkcija yra itin naudinga programoms, kurios skaitmenina ranka rašytas pastabas ar parašus. Programos gebėjimas interpretuoti įvairius teksto stilius padidina jos naudingumą švietimo ir teisinės dokumentacijos srityse. Žemiau pateiktas pavyzdys rodo, kaip atlikti ranka rašyto teksto atpažinimą naudojant Python kodą.
Kaip atlikti ranka rašyto teksto atpažinimą naudojant Python biblioteką?
api = ocr.AsposeOcr()
''' add filters if you need '''
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
#filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.contrast_correction_filter())
''' initialize image collection and put images into it '''
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
input.add("Data\\OCR\\handwritten.jpg")
''' change recognition options if you need '''
settings = ocr.RecognitionSettings()
settings.detect_areas_mode=ocr.DetectAreasMode.PHOTO
''' run recognition '''
res = api.recognize_handwritten_text(input)
print(res[0].recognition_text)
OCR pasirinktinių vaizdo regionų naudojimas Python programose
Aspose.OCR for Python via .NET suteikia pilną palaikymą teksto atpažinimui iš konkrečios vaizdo srities Python programose. Programinės įrangos kūrėjai gali nurodyti konkrečias sritis vaizde, kurias norima atpažinti, kas yra naudinga situacijose, kai tik dalis vaizdo turi reikšmingą tekstą. Kūrėjai gali apibrėžti pasirinktinius regionus OCR vaizde, nustatyti atpažinimo režimus ir koreguoti kitus parametrus, kad optimizuotų OCR procesą pagal konkrečius programos reikalavimus. Žemiau pateiktas pavyzdys rodo, kaip programinės įrangos kūrėjai gali atpažinti vieną teksto eilutę tik keliais Python kodo eilutėmis.
Kaip atpažinti vieną teksto eilutę vaizde naudojant Python programas?
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)
