1. Tuotteet
  2.   OCR
  3.   Python
  4.   Aspose.OCR Cloud SDK for Python

Aspose.OCR Cloud SDK for Python

 
 

Paras Python OCR API kuvien tekstin lukemiseen ja purkamiseen

Lisää OCR-toiminto Python-sovelluksiin OCR API:n kautta. Sen avulla voit lukea ja purkaa tekstiä kuvista, valokuvista, kuvakaappauksista, skannatuista asiakirjoista ja PDF-tiedostoista Python OCR Libraryn kautta.

Aspose.OCR Cloud SDK for Python on edistyksellinen ja joustava optinen merkintunnistusratkaisu (OCR), jonka avulla ohjelmistokehittäjät voivat luoda OCR-sovelluksia ilman ulkoisia riippuvuuksia. Sen avulla ohjelmistokehittäjät voivat lukea ja poimia tekstiä kuvista, valokuvista, kuvakaappauksista, skannatuista asiakirjoista ja PDF-tiedostoista useilla eurooppalaisilla, kyrillisillä ja itämaisilla skripteillä ja palauttaa tulokset suosituimmissa asiakirjamuodoissa. Sovellusliittymän avulla kehittäjät voivat helposti lisätä OCR-toimintoja melkein mihin tahansa laitteeseen tai alustaan, mukaan lukien netbookit, minitietokoneet tai jopa lähtötason älypuhelimet.

Aspose.OCR Cloud SDK Pythonille on suoraviivainen ja helppo käsitellä. Se tarjoaa laajan valikoiman ominaisuuksia, jotka tekevät siitä ihanteellisen tekstintunnistusratkaisun Pythonin kanssa työskenteleville kehittäjille, kuten koko kuvan lukemiseen, skannatun PDF-dokumentin lukemiseen, tekstin poimimiseen kuvan tietystä alueesta, tietojen poimimiseen skannatusta tai valokuvatusta kuvasta. kuitti, PDF-tunnistustulosten hakeminen, tekstin poimiminen skannatuista tai valokuvatuista taulukoista, tunnistustulosten muuntaminen luonnolliseksi ihmisääneksi ja paljon muuta.

Aspose.OCR Cloud SDK for Python on rakennettu Aspose.OCR Cloud API:n päälle. Se on pilvipohjainen OCR-moottori, joka tukee 45 tunnistuskieltä, mukaan lukien englanti, ranska, saksa, espanja, kiina, japani, arabia ja monta lisää. OCR SDK:n avulla Python-ohjelmoijat voivat helposti integroida OCR-toiminnot Python-sovelluksiinsa ilman, että heidän tarvitsee huolehtia OCR-tekniikan monimutkaisuudesta. SDK tarjoaa yksinkertaisen ja intuitiivisen käyttöliittymän, jonka avulla käyttäjät voivat ladata kuvia, suorittaa tekstintunnistusta ja hakea tekstiä vain muutamalla koodirivillä. Jos sinun on lisättävä Python-sovelluksiin OCR-toimintoja, Aspose.OCR Cloud SDK Pythonille on ehdottomasti tutustumisen arvoinen.

Previous Next

Pythonin Aspose.OCR Cloud SDK:n käytön aloittaminen

Suositeltu tapa asentaa Aspose.OCR Cloud SDK Pythonille käyttää pip-protokollaa. Käytä seuraavaa komentoa sujuvaan asennukseen.

Asenna Aspose.OCR Cloud SDK Pythonille pipin kautta

 pip install aspose-ocr-cloud

Voit ladata SDK:n suoraan Aspose.OCR Python Cloud SDK -tuotesivulta

Kuvantunnistus Python-sovelluksilla

Aspose.OCR Cloud SDK for Python antaa ohjelmistokehittäjille mahdollisuuden suorittaa OCR-toimintoja kuvien tunnistamiseksi omissa Python-sovelluksissaan. API on erittäin helppokäyttöinen ja kuvantunnistus voidaan suorittaa miltä tahansa alustalta, jossa on Internet-yhteys. OCR REST API:n avulla voit helposti valita ja lähettää kuvia tunnistettaviksi, hakea tuloksia ja tallentaa ne tuettuun tiedostomuotoon vain muutamalla koodirivillä. Seuraava esimerkki näyttää, kuinka OCR-toiminto suoritetaan kuville Python-koodilla.

Suorita tekstintunnistus Python-sovellusten sisällä olevalle kuvalle

import asposeocrcloud

# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')

# read the image file
with open('image.jpg', 'rb') as image_file:
    image_data = image_file.read()

# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)

# print the extracted text
print(result.text)

Pura tekstiä PDF-tiedostoista Python API:n kautta

Portable Document Format (PDF) on yksi maailman suosituimmista yritysasiakirjojen tiedostomuodoista, ja se on Adoben vuonna 1992 kehittämä tiedostomuoto asiakirjojen esittämiseen. Aspose.OCR Cloud SDK for Python on sisältänyt erittäin tehokkaan ominaisuuden tekstin poimimiseen PDF-tiedostoista Python-sovelluksissa. Tehtävän suorittamiseksi helposti sinun on ladattava PDF-tiedosto Aspose-pilvitallennustilaan ja suoritettava OCR-tunnistus ladatulle PDF-tiedostolle. Seuraava esimerkki näyttää, kuinka ohjelmistokehittäjät voivat poimia tekstiä PDF-tiedostosta Python-koodin avulla.

Kuinka purkaa tekstiä PDF-tiedostosta Python API:n kautta?

import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration

configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))

# Upload the PDF file to the Aspose cloud storage

with open('your_pdf_file.pdf', 'rb') as file:
    api.upload_file(path='your_pdf_file.pdf', file=file)

# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')

# Story the recognized text

recognized_text = result['text']
print(recognized_text)

Muunna teksti puheeksi Python-sovellusliittymän kautta

Aspose.OCR Cloud SDK for Python antaa ohjelmistokehittäjille mahdollisuuden muuntaa tekstiä kuvasta ilman kolmannen osapuolen ohjelmiston asentamista. API:n avulla ohjelmoijat voivat muuntaa tunnistustulokset luonnolliseksi ihmisääneksi, jota voidaan toistaa taustalla tai ladata. Ensin käyttäjän on lähetettävä kuva Aspose OCR Cloud -palvelimelle ja poimittava siitä tekstiä ja sen jälkeen muutettava teksti puheeksi Aspose OCR Cloud Text-to-Speech API:lla. Onnistuneen muuntamisen jälkeen voit tallentaa puhetiedoston levylle.

Kuinka muuntaa tekstiä puheeksi Python API:n avulla?

 import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi

client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))

# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
    response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)

# Extract the recognized text

text = ''
for result in response.parts:
    for line in result.lines:
        for word in line.words:
            text += word.text + ' '

# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')

# Save the speech file to disk

with open('output.wav', 'wb') as file:
    file.write(response.content)

 Suomen