Aspose.OCR Cloud SDK for Python
Paras Python OCR API kuvien tekstin lukemiseen ja purkamiseen
Lisää OCR-toiminto Python-sovelluksiin OCR API:n kautta. Sen avulla voit lukea ja purkaa tekstiä kuvista, valokuvista, kuvakaappauksista, skannatuista asiakirjoista ja PDF-tiedostoista Python OCR Libraryn kautta.
Aspose.OCR Cloud SDK for Python on edistyksellinen ja joustava optinen merkintunnistusratkaisu (OCR), jonka avulla ohjelmistokehittäjät voivat luoda OCR-sovelluksia ilman ulkoisia riippuvuuksia. Sen avulla ohjelmistokehittäjät voivat lukea ja poimia tekstiä kuvista, valokuvista, kuvakaappauksista, skannatuista asiakirjoista ja PDF-tiedostoista useilla eurooppalaisilla, kyrillisillä ja itämaisilla skripteillä ja palauttaa tulokset suosituimmissa asiakirjamuodoissa. Sovellusliittymän avulla kehittäjät voivat helposti lisätä OCR-toimintoja melkein mihin tahansa laitteeseen tai alustaan, mukaan lukien netbookit, minitietokoneet tai jopa lähtötason älypuhelimet.
Aspose.OCR Cloud SDK Pythonille on suoraviivainen ja helppo käsitellä. Se tarjoaa laajan valikoiman ominaisuuksia, jotka tekevät siitä ihanteellisen tekstintunnistusratkaisun Pythonin kanssa työskenteleville kehittäjille, kuten koko kuvan lukemiseen, skannatun PDF-dokumentin lukemiseen, tekstin poimimiseen kuvan tietystä alueesta, tietojen poimimiseen skannatusta tai valokuvatusta kuvasta. kuitti, PDF-tunnistustulosten hakeminen, tekstin poimiminen skannatuista tai valokuvatuista taulukoista, tunnistustulosten muuntaminen luonnolliseksi ihmisääneksi ja paljon muuta.
Aspose.OCR Cloud SDK for Python on rakennettu Aspose.OCR Cloud API:n päälle. Se on pilvipohjainen OCR-moottori, joka tukee 45 tunnistuskieltä, mukaan lukien englanti, ranska, saksa, espanja, kiina, japani, arabia ja monta lisää. OCR SDK:n avulla Python-ohjelmoijat voivat helposti integroida OCR-toiminnot Python-sovelluksiinsa ilman, että heidän tarvitsee huolehtia OCR-tekniikan monimutkaisuudesta. SDK tarjoaa yksinkertaisen ja intuitiivisen käyttöliittymän, jonka avulla käyttäjät voivat ladata kuvia, suorittaa tekstintunnistusta ja hakea tekstiä vain muutamalla koodirivillä. Jos sinun on lisättävä Python-sovelluksiin OCR-toimintoja, Aspose.OCR Cloud SDK Pythonille on ehdottomasti tutustumisen arvoinen.
Pythonin Aspose.OCR Cloud SDK:n käytön aloittaminen
Suositeltu tapa asentaa Aspose.OCR Cloud SDK Pythonille käyttää pip-protokollaa. Käytä seuraavaa komentoa sujuvaan asennukseen.
Asenna Aspose.OCR Cloud SDK Pythonille pipin kautta
pip install aspose-ocr-cloud
Voit ladata SDK:n suoraan Aspose.OCR Python Cloud SDK -tuotesivulta
Kuvantunnistus Python-sovelluksilla
Aspose.OCR Cloud SDK for Python antaa ohjelmistokehittäjille mahdollisuuden suorittaa OCR-toimintoja kuvien tunnistamiseksi omissa Python-sovelluksissaan. API on erittäin helppokäyttöinen ja kuvantunnistus voidaan suorittaa miltä tahansa alustalta, jossa on Internet-yhteys. OCR REST API:n avulla voit helposti valita ja lähettää kuvia tunnistettaviksi, hakea tuloksia ja tallentaa ne tuettuun tiedostomuotoon vain muutamalla koodirivillä. Seuraava esimerkki näyttää, kuinka OCR-toiminto suoritetaan kuville Python-koodilla.
Suorita tekstintunnistus Python-sovellusten sisällä olevalle kuvalle
import asposeocrcloud
# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')
# read the image file
with open('image.jpg', 'rb') as image_file:
image_data = image_file.read()
# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)
# print the extracted text
print(result.text)
Pura tekstiä PDF-tiedostoista Python API:n kautta
Portable Document Format (PDF) on yksi maailman suosituimmista yritysasiakirjojen tiedostomuodoista, ja se on Adoben vuonna 1992 kehittämä tiedostomuoto asiakirjojen esittämiseen. Aspose.OCR Cloud SDK for Python on sisältänyt erittäin tehokkaan ominaisuuden tekstin poimimiseen PDF-tiedostoista Python-sovelluksissa. Tehtävän suorittamiseksi helposti sinun on ladattava PDF-tiedosto Aspose-pilvitallennustilaan ja suoritettava OCR-tunnistus ladatulle PDF-tiedostolle. Seuraava esimerkki näyttää, kuinka ohjelmistokehittäjät voivat poimia tekstiä PDF-tiedostosta Python-koodin avulla.
Kuinka purkaa tekstiä PDF-tiedostosta Python API:n kautta?
import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration
configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))
# Upload the PDF file to the Aspose cloud storage
with open('your_pdf_file.pdf', 'rb') as file:
api.upload_file(path='your_pdf_file.pdf', file=file)
# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')
# Story the recognized text
recognized_text = result['text']
print(recognized_text)
Muunna teksti puheeksi Python-sovellusliittymän kautta
Aspose.OCR Cloud SDK for Python antaa ohjelmistokehittäjille mahdollisuuden muuntaa tekstiä kuvasta ilman kolmannen osapuolen ohjelmiston asentamista. API:n avulla ohjelmoijat voivat muuntaa tunnistustulokset luonnolliseksi ihmisääneksi, jota voidaan toistaa taustalla tai ladata. Ensin käyttäjän on lähetettävä kuva Aspose OCR Cloud -palvelimelle ja poimittava siitä tekstiä ja sen jälkeen muutettava teksti puheeksi Aspose OCR Cloud Text-to-Speech API:lla. Onnistuneen muuntamisen jälkeen voit tallentaa puhetiedoston levylle.
Kuinka muuntaa tekstiä puheeksi Python API:n avulla?
import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi
client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))
# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)
# Extract the recognized text
text = ''
for result in response.parts:
for line in result.lines:
for word in line.words:
text += word.text + ' '
# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')
# Save the speech file to disk
with open('output.wav', 'wb') as file:
file.write(response.content)