Aspose.OCR Cloud SDK for Python

Bedste Python OCR API til at læse og udtrække billedtekst

Tilføj OCR-funktionalitet til Python-apps via OCR API. Det gør det muligt at læse og udtrække tekst fra billeder, fotos, skærmbilleder, scannede dokumenter og PDF-filer via Python OCR-bibliotek.

Aspose.OCR Cloud SDK til Python er en avanceret og fleksibel optisk tegngenkendelsesløsning (OCR), der hjælper softwareudviklere med at skabe OCR-applikationer uden nogen ekstern afhængighed. Det giver softwareudviklere mulighed for at læse og udtrække tekst fra billeder, fotos, skærmbilleder, scannede dokumenter og PDF'er i et stort antal europæiske, kyrilliske og østlige scripts, hvilket giver resultater i de mest populære dokumentformater. API'et gør det nemt for udviklere at tilføje OCR-funktionalitet til næsten enhver enhed eller platform, inklusive netbooks, mini-pc'er eller endda smartphones på begynderniveau.

Aspose.OCR Cloud SDK til Python er ligetil og let at håndtere. Det giver en bred vifte af funktioner, der gør det til en ideel OCR-løsning for udviklere, der arbejder med Python, såsom at læse et helt billede, læse et scannet PDF-dokument, udtrække tekst fra et bestemt område af billedet, udtrække data fra et scannet eller fotograferet kvittering, hentning af PDF-genkendelsesresultater, udtræk af tekst fra scannede eller fotograferede tabeller, konvertering af genkendelsesresultater til en naturlig menneskelig stemme og meget mere.

Aspose.OCR Cloud SDK til Python er bygget oven på Aspose.OCR Cloud API, er en cloud-baseret OCR-motor, der understøtter 45 genkendelsessprog, herunder engelsk, fransk, tysk, spansk, kinesisk, japansk, arabisk og mange flere. Ved at bruge OCR SDK kan Python-programmører nemt integrere OCR-funktionalitet i deres Python-applikationer uden at skulle bekymre sig om kompleksiteten af OCR-teknologi. SDK'et giver en enkel og intuitiv grænseflade, der giver brugerne mulighed for at uploade billeder, udføre OCR og hente tekst på blot et par linjer kode. Hvis du har brug for at tilføje OCR-funktionalitet til dine Python-applikationer, er Aspose.OCR Cloud SDK til Python bestemt værd at tjekke ud.

Oversigt

En oversigt over Aspose.OCR Cloud SDK til Python-funktioner.

Oversigt over funktioner

Udfør OCR
Tilføj OCR-funktioner
Genkend billedtekst
Konverter billeder af tekst
Genkendt skrifttypetekst
Søg i PDF
27 genkendelsessprog
Opret OCR-apps
Gem i browser
Udtræk tekst
Multi-threading Support

Oversigt over funktioner

Genkend roteret billede
Forbehandlingsfiltre
PDF til billeder
Genkender Chines Chars
Opdager populære skrifttyper
Behandler hele billedet
Understøttelse af roterede billeder
Batchgenkendelse
Indbygget stavekontrol
Opdel PDF
PDF til Excel
PDF til SVG

Aspose.OCR Cloud SDK for Python

API understøtter hovedsageligt PDF-format, men kan eksportere PDF-dokumenter til en række andre formater.

Læser

PDF, PDF/A, TEX, XPS, SVG

Forfatter

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR Cloud SDK for Python

Platformuafhængighed

Aspose.OCR Cloud SDK til Python kan fungere med ethvert Python-baseret programmeringssprog.

Python 4.5 og nyere.

Aspose.OCR Cloud SDK for Python

Kom godt i gang med Aspose.OCR Cloud SDK til Python

Den anbefalede måde at installere Aspose.OCR Cloud SDK til Python på er at bruge pip. Brug venligst følgende kommando for en problemfri installation.

Installer Aspose.OCR Cloud SDK til Python via pip

 pip install aspose-ocr-cloud

Du kan downloade SDK'et direkte fra Aspose.OCR Python Cloud SDK-produktsiden

Billedgenkendelse ved hjælp af Python Apps

Aspose.OCR Cloud SDK til Python giver softwareudviklere mulighed for at udføre OCR-operationer for at opnå billedgenkendelse i deres egne Python-applikationer. API'en er meget nem at bruge, og billedgenkendelse kan udføres fra enhver platform med internetadgang. Du kan nemt bruge OCR REST API til at vælge og sende billeder til genkendelse, hente resultater og gemme dem i alle understøttede filformater med blot et par linjer kode. Følgende eksempel viser, hvordan man udfører OCR-operation på billeder ved hjælp af Python-kode.

Udfør OCR på et billede i Python Apps

import asposeocrcloud

# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')

# read the image file
with open('image.jpg', 'rb') as image_file:
    image_data = image_file.read()

# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)

# print the extracted text
print(result.text)

Udtræk tekst fra PDF-filer via Python API

Portable Document Format (PDF) er et af verdens mest populære filformater til forretningsdokumenter og er et filformat udviklet af Adobe i 1992 til at præsentere dokumenter. Aspose.OCR Cloud SDK til Python har inkluderet en meget kraftfuld funktion til at udtrække tekst fra PDF-filer inde i Python-applikationer. For at udføre opgaven på en nem måde skal du uploade PDF-filen til Aspose-skylageret og udføre OCR-genkendelse på den uploadede PDF-fil. Følgende eksempel viser, hvordan softwareudviklere kan udtrække tekst fra en PDF-fil ved hjælp af Python-kode.

Hvordan udtrækker du tekst fra en PDF-fil via Python API?

import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration

configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))

# Upload the PDF file to the Aspose cloud storage

with open('your_pdf_file.pdf', 'rb') as file:
    api.upload_file(path='your_pdf_file.pdf', file=file)

# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')

# Story the recognized text

recognized_text = result['text']
print(recognized_text)

Konverter tekst til tale via Python API

Aspose.OCR Cloud SDK til Python gør det muligt for softwareudviklere at konvertere tekst fra billede uden at installere nogen tredjepartssoftware. Ved hjælp af API'et kan programmører konvertere genkendelsesresultaterne til en naturlig menneskelig stemme, der kan afspilles i baggrunden eller downloades. Første brugers behov for at sende billedet til Aspose OCR Cloud-serveren og udtrække tekst fra den og derefter konvertere teksten til tale ved hjælp af Aspose OCR Cloud Text-to-Speech API. Efter den vellykkede konvertering kan du gemme talefilen på disken.

Hvordan konverteres tekst til tale ved hjælp af Python API?

 import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi

client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))

# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
    response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)

# Extract the recognized text

text = ''
for result in response.parts:
    for line in result.lines:
        for word in line.words:
            text += word.text + ' '

# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')

# Save the speech file to disk

with open('output.wav', 'wb') as file:
    file.write(response.content)