Aspose.OCR Cloud SDK for Python
Bedste Python OCR API til at læse og udtrække billedtekst
Tilføj OCR-funktionalitet til Python-apps via OCR API. Det gør det muligt at læse og udtrække tekst fra billeder, fotos, skærmbilleder, scannede dokumenter og PDF-filer via Python OCR-bibliotek.
Aspose.OCR Cloud SDK til Python er en avanceret og fleksibel optisk tegngenkendelsesløsning (OCR), der hjælper softwareudviklere med at skabe OCR-applikationer uden nogen ekstern afhængighed. Det giver softwareudviklere mulighed for at læse og udtrække tekst fra billeder, fotos, skærmbilleder, scannede dokumenter og PDF'er i et stort antal europæiske, kyrilliske og østlige scripts, hvilket giver resultater i de mest populære dokumentformater. API'et gør det nemt for udviklere at tilføje OCR-funktionalitet til næsten enhver enhed eller platform, inklusive netbooks, mini-pc'er eller endda smartphones på begynderniveau.
Aspose.OCR Cloud SDK til Python er ligetil og let at håndtere. Det giver en bred vifte af funktioner, der gør det til en ideel OCR-løsning for udviklere, der arbejder med Python, såsom at læse et helt billede, læse et scannet PDF-dokument, udtrække tekst fra et bestemt område af billedet, udtrække data fra et scannet eller fotograferet kvittering, hentning af PDF-genkendelsesresultater, udtræk af tekst fra scannede eller fotograferede tabeller, konvertering af genkendelsesresultater til en naturlig menneskelig stemme og meget mere.
Aspose.OCR Cloud SDK til Python er bygget oven på Aspose.OCR Cloud API, er en cloud-baseret OCR-motor, der understøtter 45 genkendelsessprog, herunder engelsk, fransk, tysk, spansk, kinesisk, japansk, arabisk og mange flere. Ved at bruge OCR SDK kan Python-programmører nemt integrere OCR-funktionalitet i deres Python-applikationer uden at skulle bekymre sig om kompleksiteten af OCR-teknologi. SDK'et giver en enkel og intuitiv grænseflade, der giver brugerne mulighed for at uploade billeder, udføre OCR og hente tekst på blot et par linjer kode. Hvis du har brug for at tilføje OCR-funktionalitet til dine Python-applikationer, er Aspose.OCR Cloud SDK til Python bestemt værd at tjekke ud.
Kom godt i gang med Aspose.OCR Cloud SDK til Python
Den anbefalede måde at installere Aspose.OCR Cloud SDK til Python på er at bruge pip. Brug venligst følgende kommando for en problemfri installation.
Installer Aspose.OCR Cloud SDK til Python via pip
pip install aspose-ocr-cloud
Du kan downloade SDK'et direkte fra Aspose.OCR Python Cloud SDK-produktsiden
Billedgenkendelse ved hjælp af Python Apps
Aspose.OCR Cloud SDK til Python giver softwareudviklere mulighed for at udføre OCR-operationer for at opnå billedgenkendelse i deres egne Python-applikationer. API'en er meget nem at bruge, og billedgenkendelse kan udføres fra enhver platform med internetadgang. Du kan nemt bruge OCR REST API til at vælge og sende billeder til genkendelse, hente resultater og gemme dem i alle understøttede filformater med blot et par linjer kode. Følgende eksempel viser, hvordan man udfører OCR-operation på billeder ved hjælp af Python-kode.
Udfør OCR på et billede i Python Apps
import asposeocrcloud
# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')
# read the image file
with open('image.jpg', 'rb') as image_file:
image_data = image_file.read()
# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)
# print the extracted text
print(result.text)
Udtræk tekst fra PDF-filer via Python API
Portable Document Format (PDF) er et af verdens mest populære filformater til forretningsdokumenter og er et filformat udviklet af Adobe i 1992 til at præsentere dokumenter. Aspose.OCR Cloud SDK til Python har inkluderet en meget kraftfuld funktion til at udtrække tekst fra PDF-filer inde i Python-applikationer. For at udføre opgaven på en nem måde skal du uploade PDF-filen til Aspose-skylageret og udføre OCR-genkendelse på den uploadede PDF-fil. Følgende eksempel viser, hvordan softwareudviklere kan udtrække tekst fra en PDF-fil ved hjælp af Python-kode.
Hvordan udtrækker du tekst fra en PDF-fil via Python API?
import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration
configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))
# Upload the PDF file to the Aspose cloud storage
with open('your_pdf_file.pdf', 'rb') as file:
api.upload_file(path='your_pdf_file.pdf', file=file)
# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')
# Story the recognized text
recognized_text = result['text']
print(recognized_text)
Konverter tekst til tale via Python API
Aspose.OCR Cloud SDK til Python gør det muligt for softwareudviklere at konvertere tekst fra billede uden at installere nogen tredjepartssoftware. Ved hjælp af API'et kan programmører konvertere genkendelsesresultaterne til en naturlig menneskelig stemme, der kan afspilles i baggrunden eller downloades. Første brugers behov for at sende billedet til Aspose OCR Cloud-serveren og udtrække tekst fra den og derefter konvertere teksten til tale ved hjælp af Aspose OCR Cloud Text-to-Speech API. Efter den vellykkede konvertering kan du gemme talefilen på disken.
Hvordan konverteres tekst til tale ved hjælp af Python API?
import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi
client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))
# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)
# Extract the recognized text
text = ''
for result in response.parts:
for line in result.lines:
for word in line.words:
text += word.text + ' '
# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')
# Save the speech file to disk
with open('output.wav', 'wb') as file:
file.write(response.content)