Aspose.OCR Cloud SDK for Python
Beste Python OCR API om afbeeldingentekst te lezen en te extraheren
Voeg OCR-functionaliteit toe aan Python-apps via OCR API. Hiermee kunt u tekst uit afbeeldingen, foto's, schermafbeeldingen, gescande documenten en PDF-bestanden lezen en extraheren via de Python OCR-bibliotheek.
Aspose.OCR Cloud SDK voor Python is een geavanceerde en flexibele oplossing voor optische tekenherkenning (OCR) waarmee softwareontwikkelaars OCR-applicaties kunnen maken zonder enige externe afhankelijkheden. Het stelt softwareontwikkelaars in staat tekst te lezen en te extraheren uit afbeeldingen, foto's, schermafbeeldingen, gescande documenten en pdf's in een groot aantal Europese, cyrillische en oosterse scripts, waarbij resultaten worden geretourneerd in de meest populaire documentformaten. Met de API kunnen ontwikkelaars eenvoudig OCR-functionaliteit toevoegen aan vrijwel elk apparaat of platform, inclusief netbooks, mini-pc's of zelfs smartphones op instapniveau.
De Aspose.OCR Cloud SDK voor Python is eenvoudig en gemakkelijk te gebruiken. Het biedt een breed scala aan functies die het tot een ideale OCR-oplossing maken voor ontwikkelaars die met Python werken, zoals het lezen van een hele afbeelding, het lezen van een gescand PDF-document, het extraheren van tekst uit een specifiek gebied van de afbeelding, het extraheren van gegevens uit een gescand of gefotografeerd document. ontvangstbewijs, het ophalen van PDF-herkenningsresultaten, het extraheren van tekst uit gescande of gefotografeerde tabellen, het omzetten van de herkenningsresultaten in een natuurlijke menselijke stem, en nog veel meer.
Aspose.OCR Cloud SDK voor Python is gebouwd bovenop de Aspose.OCR Cloud API en is een cloudgebaseerde OCR-engine die 45 herkenningstalen ondersteunt, waaronder Engels, Frans, Duits, Spaans, Chinees, Japans, Arabisch en veel meer. Met behulp van de OCR SDK kunnen Python-programmeurs eenvoudig OCR-functionaliteit integreren in hun Python-applicaties zonder zich zorgen te hoeven maken over de complexiteit van OCR-technologie. De SDK biedt een eenvoudige en intuïtieve interface waarmee gebruikers afbeeldingen kunnen uploaden, OCR kunnen uitvoeren en tekst kunnen ophalen in slechts een paar regels code. Als je OCR-functionaliteit aan je Python-applicaties moet toevoegen, is de Aspose.OCR Cloud SDK voor Python zeker de moeite van het bekijken waard.
Aan de slag met Aspose.OCR Cloud SDK voor Python
De aanbevolen manier om Aspose.OCR Cloud SDK voor Python te installeren is met behulp van pip. Gebruik het volgende commando voor een vlotte installatie.
Installeer Aspose.OCR Cloud SDK voor Python via pip
pip install aspose-ocr-cloud
Je kunt de SDK rechtstreeks downloaden vanaf de Aspose.OCR Python Cloud SDK productpagina
Beeldherkenning met Python-apps
Aspose.OCR Cloud SDK voor Python stelt softwareontwikkelaars in staat OCR-bewerkingen uit te voeren om beeldherkenning binnen hun eigen Python-applicaties te realiseren. De API is zeer eenvoudig te gebruiken en beeldherkenning kan worden uitgevoerd vanaf elk platform met internettoegang. U kunt eenvoudig de OCR REST API gebruiken om afbeeldingen te selecteren en ter herkenning te verzenden, resultaten op te halen en deze op te slaan in alle ondersteunde bestandsformaten met slechts een paar regels code. In het volgende voorbeeld ziet u hoe u een OCR-bewerking uitvoert op afbeeldingen met behulp van Python-code.
Voer OCR uit op een afbeelding in Python Apps
import asposeocrcloud
# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')
# read the image file
with open('image.jpg', 'rb') as image_file:
image_data = image_file.read()
# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)
# print the extracted text
print(result.text)
Tekst uit PDF-bestanden extraheren via Python API
Portable Document Format (PDF) is een van 's werelds populairste bestandsformaten voor zakelijke documenten en is een bestandsformaat dat in 1992 door Adobe is ontwikkeld om documenten te presenteren. Aspose.OCR Cloud SDK voor Python heeft een zeer krachtige functie toegevoegd voor het extraheren van tekst uit PDF-bestanden in Python-applicaties. Om de taak op een eenvoudige manier uit te voeren, moet u het PDF-bestand uploaden naar de Aspose-cloudopslag en de OCR-herkenning uitvoeren op het geüploade PDF-bestand. Het volgende voorbeeld laat zien hoe softwareontwikkelaars tekst uit een PDF-bestand kunnen extraheren met behulp van Python-code.
Hoe tekst uit een PDF-bestand extraheren via de Python API?
import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration
configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))
# Upload the PDF file to the Aspose cloud storage
with open('your_pdf_file.pdf', 'rb') as file:
api.upload_file(path='your_pdf_file.pdf', file=file)
# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')
# Story the recognized text
recognized_text = result['text']
print(recognized_text)
Tekst naar spraak converteren via Python API
Aspose.OCR Cloud SDK voor Python stelt softwareontwikkelaars in staat tekst van afbeelding te converteren zonder software van derden te installeren. Met behulp van de API kunnen programmeurs de herkenningsresultaten omzetten in een natuurlijke menselijke stem die op de achtergrond kan worden afgespeeld of gedownload. De eerste gebruiker moet de afbeelding naar de Aspose OCR Cloud-server sturen en er tekst uit extraheren en daarna de tekst naar spraak converteren met behulp van de Aspose OCR Cloud Text-to-Speech API. Na de succesvolle conversie kunt u het spraakbestand op schijf opslaan.
Hoe kan ik tekst naar spraak converteren met de Python API?
import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi
client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))
# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)
# Extract the recognized text
text = ''
for result in response.parts:
for line in result.lines:
for word in line.words:
text += word.text + ' '
# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')
# Save the speech file to disk
with open('output.wav', 'wb') as file:
file.write(response.content)