Aspose.OCR Cloud SDK for Python
Geriausia Python OCR API, skirta skaityti ir išgauti vaizdų tekstą
Pridėkite OCR funkciją prie Python Apps per OCR API. Tai leidžia skaityti ir ištraukti tekstą iš vaizdų, nuotraukų, ekrano kopijų, nuskaitytų dokumentų ir PDF failų per Python OCR biblioteką.
Aspose.OCR Cloud SDK, skirta Python, yra pažangus ir lankstus optinio simbolių atpažinimo (OCR) sprendimas, padedantis programinės įrangos kūrėjams kurti OCR programas be jokių išorinių priklausomybių. Tai leidžia programinės įrangos kūrėjams skaityti ir išgauti tekstą iš vaizdų, nuotraukų, ekrano kopijų, nuskaitytų dokumentų ir PDF rinkmenų daugeliu Europos, kirilicos ir Rytų scenarijų, o rezultatai pateikiami populiariausiais dokumentų formatais. Naudodami API kūrėjai gali lengvai pridėti OCR funkciją beveik prie bet kurio įrenginio ar platformos, įskaitant nešiojamuosius kompiuterius, mini kompiuterius ar net pradinio lygio išmaniuosius telefonus.
Aspose.OCR Cloud SDK, skirtas Python, yra paprastas ir lengvai valdomas. Jame yra daugybė funkcijų, dėl kurių jis yra idealus OCR sprendimas kūrėjams, dirbantiems su Python, pavyzdžiui, viso vaizdo skaitymui, nuskaityto PDF dokumento skaitymui, teksto ištraukimui iš konkretaus vaizdo regiono, duomenų iš nuskaityto ar nufotografuoto vaizdo ištraukimo. kvitas, PDF atpažinimo rezultatų gavimas, teksto ištraukimas iš nuskaitytų ar nufotografuotų lentelių, atpažinimo rezultatų konvertavimas į natūralų žmogaus balsą ir daug daugiau.
Aspose.OCR Cloud SDK, skirtas Python, sukurtas ant Aspose.OCR Cloud API. Tai debesies pagrindu sukurtas OCR variklis, palaikantis 45 atpažinimo kalbas, įskaitant anglų, prancūzų, vokiečių, ispanų, kinų, japonų, arabų ir daug daugiau. Naudodami OCR SDK, Python programuotojai gali lengvai integruoti OCR funkcijas į savo Python programas, nesijaudindami dėl OCR technologijos sudėtingumo. SDK suteikia paprastą ir intuityvią sąsają, leidžiančią vartotojams įkelti vaizdus, atlikti OCR ir nuskaityti tekstą vos keliomis kodo eilutėmis. Jei savo Python programoms reikia pridėti OCR funkcijų, tikrai verta patikrinti Aspose.OCR Cloud SDK, skirtą Python.
Pradžia su Aspose.OCR Cloud SDK, skirta Python
Rekomenduojamas būdas įdiegti Aspose.OCR Cloud SDK, skirtą Python, yra naudoti pip. Norėdami sklandžiai įdiegti, naudokite šią komandą.
Įdiekite Aspose.OCR Cloud SDK, skirtą Python per pip
pip install aspose-ocr-cloud
SDK galite atsisiųsti tiesiogiai iš Aspose.OCR Python Cloud SDK produkto puslapio
Vaizdo atpažinimas naudojant Python Apps
Aspose.OCR Cloud SDK, skirta Python, leidžia programinės įrangos kūrėjams atlikti OCR operacijas, kad atpažintų vaizdą savo Python programose. API labai paprasta naudoti, o vaizdų atpažinimas gali būti atliekamas iš bet kurios platformos su interneto prieiga. Galite lengvai naudoti OCR REST API norėdami pasirinkti ir siųsti vaizdus atpažinti, gauti rezultatus ir išsaugoti juos bet kokiais palaikomais failų formatais naudodami tik kelias kodo eilutes. Šiame pavyzdyje parodyta, kaip atlikti OCR operaciją vaizduose naudojant Python kodą.
Atlikite OCR vaizdui Python Apps
import asposeocrcloud
# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')
# read the image file
with open('image.jpg', 'rb') as image_file:
image_data = image_file.read()
# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)
# print the extracted text
print(result.text)
Ištraukite tekstą iš PDF failų naudodami Python API
Portable Document Format (PDF) yra vienas populiariausių pasaulyje verslo dokumentų failų formatų. Tai failo formatas, kurį „Adobe“ sukūrė 1992 m. dokumentams pateikti. Aspose.OCR Cloud SDK, skirta Python, įtraukė labai galingą funkciją, skirtą tekstui išgauti iš PDF failų Python programose. Norėdami lengvai atlikti užduotį, turite įkelti PDF failą į Aspose debesies saugyklą ir atlikti įkelto PDF failo OCR atpažinimą. Šiame pavyzdyje parodyta, kaip programinės įrangos kūrėjai gali išgauti tekstą iš PDF failo naudodami Python kodą.
Kaip ištraukti tekstą iš PDF failo naudojant Python API?
import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration
configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))
# Upload the PDF file to the Aspose cloud storage
with open('your_pdf_file.pdf', 'rb') as file:
api.upload_file(path='your_pdf_file.pdf', file=file)
# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')
# Story the recognized text
recognized_text = result['text']
print(recognized_text)
Konvertuokite tekstą į kalbą naudodami Python API
Aspose.OCR Cloud SDK, skirta Python, leidžia programinės įrangos kūrėjams konvertuoti tekstą iš vaizdo neįdiegiant jokios trečiosios šalies programinės įrangos. Naudodami API programuotojai atpažinimo rezultatus gali konvertuoti į natūralų žmogaus balsą, kurį galima leisti fone arba atsisiųsti. Pirmiausia vartotojas turi nusiųsti vaizdą į Aspose OCR Cloud serverį ir iš jo išgauti tekstą, o po to konvertuoti tekstą į kalbą naudojant Aspose OCR Cloud Text-to-Speech API. Po sėkmingo konvertavimo galite įrašyti kalbos failą į diską.
Kaip konvertuoti tekstą į kalbą naudojant Python API?
import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi
client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))
# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)
# Extract the recognized text
text = ''
for result in response.parts:
for line in result.lines:
for word in line.words:
text += word.text + ' '
# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')
# Save the speech file to disk
with open('output.wav', 'wb') as file:
file.write(response.content)