
Aspose.OCR for Python via .NET
Les og hent ut tekst fra bilder via Python API
Ledende kraftig Python OCR API gjør det mulig for utviklere å lese og hente ut tekst fra bilder, fotografier, skjermbilder, skannede dokumenter og PDF-filer.
I dagens digitale tidsalder har konvertering av bilder til redigerbare tekstformater blitt en viktig oppgave for mange virksomheter og utviklere. Aspose.OCR for Python via .NET gir en robust løsning for optisk tegngjenkjenning (OCR) som gjør det mulig for programvareutviklere å hente ut tekst fra bilder uten problemer. Aspose.OCR for Python via .NET er et kraftig bibliotek designet for OCR-oppgaver. Det er en del av Aspose-serien av produkter, som er kjent for å levere høykvalitets dokumentbehandlingsverktøy. Dette biblioteket lar utviklere utnytte .NET-rammeverkets muligheter mens de programmerer i Python, og muliggjør dermed plattformuavhengige applikasjoner som kan utføre OCR-operasjoner sømløst. Det støtter gjenkjenning av tekst på over 100 språk, inkludert engelsk, spansk, fransk, tysk, italiensk, kinesisk, japansk og mange flere.
Aspose.OCR for Python via .NET er et .NET-basert OCR-bibliotek som lar utviklere gjenkjenne og hente ut tekst fra ulike bildeformater, inkludert JPEG, PNG, GIF, BMP og TIFF. API-et bruker avanserte algoritmer for å sikre høy nøyaktighet i tekstgjenkjenning fra ulike bildeformater. Det støtter gjenkjenning av tekst i forskjellige skrifttyper og stiler. For å forbedre gjenkjenningsnøyaktigheten tilbyr Aspose.OCR forbehandlingsfunksjoner som binarisering, retting av skjevhet og fjerning av støy. Dette hjelper med å forberede bilder for bedre OCR-resultater. Det kan håndtere flere bilder i én prosess, noe som muliggjør batch-behandling og sparer tid i situasjoner hvor store mengder bilder må behandles. Med sine avanserte funksjoner, inkludert støtte for flere språk, bildeforbehandling, layout-analyse og feilbehandling, er Aspose.OCR et ideelt valg for programvareutviklere som ønsker å jobbe med OCR-baserte prosjekter.
Kom i gang med Aspose.OCR for Python via .NET
Den anbefalte måten å installere Aspose.OCR for Python via .NET på er ved å bruke pip. Vennligst bruk følgende kommando for en enkel installasjon.
Installer Aspose.OCR for Python via .NET via pip
pip install aspose-ocr-python-netDu kan laste ned SDK-en direkte fra Aspose.OCR Python Cloud SDK produktets side
OCR-operasjoner med høy nøyaktighet via Python
Aspose.OCR for Python via .NET er konstruert for høy presisjon og nøyaktighet. Biblioteket inkorporerer avanserte maskinlæringsmodeller som forbedrer nøyaktigheten ved tekstuttrekk, selv med skjeve eller lavoppløselige bilder. Denne funksjonen gjør det egnet for applikasjoner som krever pålitelig tekstgjenkjenning, som automatisert datauttrekk fra skannede skjemaer eller dokumenter. Følgende kodeeksempel viser en enkel implementering hvor et bilde lastes inn, behandles, og den gjenkjente teksten vises.
Hvordan laste inn bilder, utføre OCR og hente ut tekst via Python API?
# Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Bildeforbehandlingsfunksjoner
Aspose.OCR for Python via .NET-biblioteket tilbyr kraftige bildeforbehandlingsfunksjoner i Python-applikasjoner. Funksjonene forbedrer OCR-nøyaktigheten, som skjevhetskorrigering, fjerning av støy og bildenormalisering. Disse forbehandlingsstegene er avgjørende når du arbeider med bilder som kan ha blitt skannet under suboptimale forhold. Følgende eksempel demonstrerer hvordan utviklere kan utføre skjevhetskorrigering som sikrer at tekst blir nøyaktig oppdaget, selv om bildet er litt skråstilt eller ikke helt justert.
Hvordan utføre OCR-operasjon med skjevhetskorrigering i Python-apper?
from aspose.ocr import OcrEngine, SkewCorrection
ocr_engine = OcrEngine()
# Enable skew correction
ocr_engine.set_skew_correction(SkewCorrection.True)
ocr_engine.image = "skewed_image.png"
recognized_text = ocr_engine.get_text()
print("Corrected and Recognized Text:", recognized_text)
Gjenkjenning av håndskrevet tekst via Python
Aspose.OCR for Python via .NET er svært enkelt å bruke og kan gjenkjenne både trykt og håndskrevet tekst med bare noen få linjer Python-kode. Denne funksjonen er svært nyttig for applikasjoner som digitaliserer håndskrevne notater eller signaturer. Programvarens evne til å tolke ulike tekststiler øker nytteverdien i sektorer som utdanning og juridisk dokumentasjon. Her er et eksempel som viser hvordan man utfører håndskrevet tekstgjenkjenning ved hjelp av Python-kode.
Hvordan utføre håndskrevet tekstgjenkjenning via Python-biblioteket?
api = ocr.AsposeOcr()
''' add filters if you need '''
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
#filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.contrast_correction_filter())
''' initialize image collection and put images into it '''
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
input.add("Data\\OCR\\handwritten.jpg")
''' change recognition options if you need '''
settings = ocr.RecognitionSettings()
settings.detect_areas_mode=ocr.DetectAreasMode.PHOTO
''' run recognition '''
res = api.recognize_handwritten_text(input)
print(res[0].recognition_text)
Tilpassede OCR-bildeområder i Python-apper
Aspose.OCR for Python via .NET har full støtte for å gjenkjenne tekst fra et bestemt område av et bilde i Python-applikasjoner. Programvareutviklere kan spesifisere spesifikke områder innen et bilde for OCR, noe som er nyttig i scenarier hvor kun en del av bildet inneholder relevant tekst. Utviklere kan definere tilpassede områder for OCR på et bilde, sette gjenkjenningsmoduser og justere andre parametere for å optimalisere OCR-prosessen basert på spesifikke applikasjonskrav. Her er et eksempel som viser hvordan utviklere kan gjenkjenne en enkelt linje med tekst med bare noen få linjer Python-kode.
Hvordan gjenkjenne en enkelt linje med tekst på et bilde via Python-apper?
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)
