Aspose.OCR Cloud SDK for Python
Labākā Python OCR API attēlu teksta lasīšanai un izvilkšanai
Pievienojiet Python Apps OCR funkcionalitāti, izmantojot OCR API. Tas ļauj lasīt un izvilkt tekstu no attēliem, fotoattēliem, ekrānuzņēmumiem, skenētiem dokumentiem un PDF failiem, izmantojot Python OCR bibliotēku.
Aspose.OCR Cloud SDK for Python ir uzlabots un elastīgs optiskās rakstzīmju atpazīšanas (OCR) risinājums, kas palīdz programmatūras izstrādātājiem izveidot OCR lietojumprogrammas bez ārējām atkarībām. Tas ļauj programmatūras izstrādātājiem lasīt un izvilkt tekstu no attēliem, fotoattēliem, ekrānuzņēmumiem, skenētiem dokumentiem un PDF failiem daudzos Eiropas, kirilicas un austrumu skriptos, atgriežot rezultātus populārākajos dokumentu formātos. API ļauj izstrādātājiem viegli pievienot OCR funkcionalitāti gandrīz jebkurai ierīcei vai platformai, tostarp netbook datoriem, mini personālajiem datoriem vai pat sākuma līmeņa viedtālruņiem.
Aspose.OCR Cloud SDK darbam ar Python ir vienkāršs un viegli apstrādājams. Tas nodrošina plašu funkciju klāstu, kas padara to par ideālu OCR risinājumu izstrādātājiem, kuri strādā ar Python, piemēram, visa attēla lasīšanai, skenēta PDF dokumenta lasīšanai, teksta izvilkšanai no noteikta attēla reģiona, datu izvilkšanai no skenēta vai fotografēta attēla. kvīts, PDF atpazīšanas rezultātu iegūšana, teksta izvilkšana no skenētām vai fotografētām tabulām, atpazīšanas rezultātu pārvēršana dabiskā cilvēka balsī un daudz kas cits.
Aspose.OCR Cloud SDK for Python ir veidots, pamatojoties uz Aspose.OCR Cloud API, ir uz mākoņiem balstīts OCR dzinējs, kas atbalsta 45 atpazīšanas valodas, tostarp angļu, franču, vācu, spāņu, ķīniešu, japāņu, arābu un daudz vairāk. Izmantojot OCR SDK, Python programmētāji var viegli integrēt OCR funkcionalitāti savās Python lietojumprogrammās, neuztraucoties par OCR tehnoloģijas sarežģītību. SDK nodrošina vienkāršu un intuitīvu saskarni, kas ļauj lietotājiem augšupielādēt attēlus, veikt OCR un izgūt tekstu tikai dažās koda rindās. Ja Python lietojumprogrammām ir jāpievieno OCR funkcionalitāte, noteikti ir vērts pārbaudīt Aspose.OCR Cloud SDK, kas paredzēts Python.
Darba sākšana ar Aspose.OCR Cloud SDK darbam ar Python
Ieteicamais veids, kā instalēt Aspose.OCR Cloud SDK for Python, ir izmantot pip. Lūdzu, izmantojiet šo komandu vienmērīgai instalēšanai.
Instalējiet Aspose.OCR Cloud SDK platformai Python, izmantojot pip
pip install aspose-ocr-cloud
Varat lejupielādēt SDK tieši no Aspose.OCR Python Cloud SDK produkta lapas
Attēla atpazīšana, izmantojot Python lietotnes
Aspose.OCR Cloud SDK for Python ļauj programmatūras izstrādātājiem veikt OCR darbību, lai panāktu attēla atpazīšanu savās Python lietojumprogrammās. API ir ļoti viegli lietojams, un attēlu atpazīšanu var veikt no jebkuras platformas ar piekļuvi internetam. Varat viegli izmantot OCR REST API, lai atlasītu un nosūtītu attēlus atpazīšanai, iegūtu rezultātus un saglabātu tos jebkurā atbalstītā failu formātā, izmantojot tikai dažas koda rindiņas. Šis piemērs parāda, kā veikt OCR darbību attēliem, izmantojot Python kodu.
Veiciet OCR attēlam Python lietotnēs
import asposeocrcloud
# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')
# read the image file
with open('image.jpg', 'rb') as image_file:
image_data = image_file.read()
# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)
# print the extracted text
print(result.text)
Izņemiet tekstu no PDF failiem, izmantojot Python API
Pārnēsājamais dokumentu formāts (PDF) ir viens no pasaulē populārākajiem biznesa dokumentu failu formātiem, un to 1992. gadā izstrādāja Adobe, lai prezentētu dokumentus. Aspose.OCR Cloud SDK for Python ir iekļāvis ļoti jaudīgu līdzekli teksta iegūšanai no PDF failiem Python lietojumprogrammās. Lai viegli izpildītu uzdevumu, jums ir jāaugšupielādē PDF fails Aspose mākoņkrātuvē un jāveic OCR atpazīšana augšupielādētajam PDF failam. Šis piemērs parāda, kā programmatūras izstrādātāji var izvilkt tekstu no PDF faila, izmantojot Python kodu.
Kā izvilkt tekstu no PDF faila, izmantojot Python API?
import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration
configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))
# Upload the PDF file to the Aspose cloud storage
with open('your_pdf_file.pdf', 'rb') as file:
api.upload_file(path='your_pdf_file.pdf', file=file)
# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')
# Story the recognized text
recognized_text = result['text']
print(recognized_text)
Pārveidojiet tekstu runā, izmantojot Python API
Aspose.OCR Cloud SDK for Python ļauj programmatūras izstrādātājiem konvertēt tekstu no attēla, neinstalējot trešo pušu programmatūru. Izmantojot API, programmētāji var pārvērst atpazīšanas rezultātus dabiskā cilvēka balsī, ko var atskaņot fonā vai lejupielādēt. Vispirms lietotājam ir jānosūta attēls uz Aspose OCR Cloud serveri un jāizvelk teksts no tā un pēc tam jāpārvērš teksts runā, izmantojot Aspose OCR Cloud teksta-runas API. Pēc veiksmīgas konvertēšanas runas failu var saglabāt diskā.
Kā pārvērst tekstu runā, izmantojot Python API?
import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi
client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))
# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)
# Extract the recognized text
text = ''
for result in response.parts:
for line in result.lines:
for word in line.words:
text += word.text + ' '
# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')
# Save the speech file to disk
with open('output.wav', 'wb') as file:
file.write(response.content)