Aspose.OCR Cloud SDK for Python
Beste Python OCR API for å lese og trekke ut bildetekst
Legg til OCR-funksjonalitet til Python-apper via OCR API. Den lar deg lese og trekke ut tekst fra bilder, bilder, skjermbilder, skannede dokumenter og PDF-filer via Python OCR Library.
Aspose.OCR Cloud SDK for Python er en avansert og fleksibel løsning for optisk tegngjenkjenning (OCR) som hjelper programvareutviklere med å lage OCR-applikasjoner uten eksterne avhengigheter. Den lar programvareutviklere lese og trekke ut tekst fra bilder, bilder, skjermbilder, skannede dokumenter og PDF-er i et stort antall europeiske, kyrilliske og østlige skript, og gir resultater i de mest populære dokumentformatene. API-en gjør det enkelt for utviklere å legge til OCR-funksjonalitet til nesten hvilken som helst enhet eller plattform, inkludert netbooks, mini-PC-er eller til og med smarttelefoner på startnivå.
Aspose.OCR Cloud SDK for Python er enkel og enkel å håndtere. Det gir et bredt spekter av funksjoner som gjør det til en ideell OCR-løsning for utviklere som arbeider med Python, for eksempel å lese et helt bilde, lese et skannet PDF-dokument, trekke ut tekst fra et bestemt område av bildet, trekke ut data fra et skannet eller fotografert kvittering, hente PDF-gjenkjenningsresultater, trekke ut tekst fra skannede eller fotograferte tabeller, konvertere gjenkjenningsresultatene til en naturlig menneskelig stemme og mye mer.
Aspose.OCR Cloud SDK for Python er bygget på toppen av Aspose.OCR Cloud API, er en skybasert OCR-motor som støtter 45 gjenkjenningsspråk, inkludert engelsk, fransk, tysk, spansk, kinesisk, japansk, arabisk og mange flere. Ved å bruke OCR SDK kan Python-programmerere enkelt integrere OCR-funksjonalitet i Python-applikasjonene sine uten å måtte bekymre seg for kompleksiteten til OCR-teknologi. SDK gir et enkelt og intuitivt grensesnitt som lar brukere laste opp bilder, utføre OCR og hente tekst på bare noen få linjer med kode. Hvis du trenger å legge til OCR-funksjonalitet til Python-applikasjonene dine, er Aspose.OCR Cloud SDK for Python definitivt verdt å sjekke ut.
Kom i gang med Aspose.OCR Cloud SDK for Python
Den anbefalte måten å installere Aspose.OCR Cloud SDK for Python på er å bruke pip. Bruk følgende kommando for en jevn installasjon.
Installer Aspose.OCR Cloud SDK for Python via pip
pip install aspose-ocr-cloud
Du kan laste ned SDK-en direkte fra Aspose.OCR Python Cloud SDK-produktsiden
Bildegjenkjenning ved hjelp av Python-apper
Aspose.OCR Cloud SDK for Python lar programvareutviklere utføre OCR-operasjoner for å oppnå bildegjenkjenning i sine egne Python-applikasjoner. API-en er veldig enkel å bruke og bildegjenkjenning kan utføres fra enhver plattform med Internett-tilgang. Du kan enkelt bruke OCR REST API til å velge og sende bilder for gjenkjenning, hente resultater og lagre det i alle støttede filformater med bare et par linjer med kode. Følgende eksempel viser hvordan du utfører OCR-operasjon på bilder ved hjelp av Python-kode.
Utfør OCR på et bilde i Python Apps
import asposeocrcloud
# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')
# read the image file
with open('image.jpg', 'rb') as image_file:
image_data = image_file.read()
# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)
# print the extracted text
print(result.text)
trekk ut tekst fra PDF-filer via Python API
Portable Document Format (PDF) er et av verdens mest populære filformater for forretningsdokumenter og er et filformat utviklet av Adobe i 1992 for å presentere dokumenter. Aspose.OCR Cloud SDK for Python har inkludert en veldig kraftig funksjon for å trekke ut tekst fra PDF-filer i Python-applikasjoner. For å oppnå oppgaven på en enkel måte må du laste opp PDF-filen til Aspose-skylagringen og utføre OCR-gjenkjenning på den opplastede PDF-filen. Følgende eksempel viser hvordan programvareutviklere kan trekke ut tekst fra en PDF-fil ved hjelp av Python-kode.
Hvordan trekke ut tekst fra en PDF-fil via Python API?
import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration
configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))
# Upload the PDF file to the Aspose cloud storage
with open('your_pdf_file.pdf', 'rb') as file:
api.upload_file(path='your_pdf_file.pdf', file=file)
# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')
# Story the recognized text
recognized_text = result['text']
print(recognized_text)
Konverter tekst til tale via Python API
Aspose.OCR Cloud SDK for Python gjør det mulig for programvareutviklere å konvertere tekst fra bilde uten å installere tredjepartsprogramvare. Ved å bruke API kan programmerere konvertere gjenkjenningsresultatene til en naturlig menneskelig stemme som kan spilles av i bakgrunnen eller lastes ned. Første brukers behov for å sende bildet til Aspose OCR Cloud-server og trekke ut tekst fra den og deretter konvertere teksten til tale ved hjelp av Aspose OCR Cloud Text-to-Speech API. Etter vellykket konvertering kan du lagre talefilen på disk.
Hvordan konverterer du tekst til tale ved hjelp av Python API?
import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi
client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))
# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)
# Extract the recognized text
text = ''
for result in response.parts:
for line in result.lines:
for word in line.words:
text += word.text + ' '
# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')
# Save the speech file to disk
with open('output.wav', 'wb') as file:
file.write(response.content)