1. Termékek
  2.   OCR
  3.   Python
  4.   Aspose.OCR Cloud SDK for Python

Aspose.OCR Cloud SDK for Python

 
 

A legjobb Python OCR API a képek szövegének olvasásához és kibontásához

Adja hozzá az OCR-funkciókat a Python-alkalmazásokhoz az OCR API-n keresztül. Lehetővé teszi a képek, fényképek, képernyőképek, szkennelt dokumentumok és PDF-fájlok szövegének olvasását és kibontását a Python OCR Library segítségével.

Az Aspose.OCR Cloud SDK for Python egy fejlett és rugalmas optikai karakterfelismerő (OCR) megoldás, amely segít a szoftverfejlesztőknek OCR-alkalmazások létrehozásában külső függőségek nélkül. Lehetővé teszi a szoftverfejlesztők számára, hogy szöveget olvassanak és bontsanak ki képekből, fényképekből, képernyőképekből, beszkennelt dokumentumokból és PDF-fájlokból számos európai, cirill és keleti szkriptben, így a legnépszerűbb dokumentumformátumokban adják vissza az eredményeket. Az API megkönnyíti a fejlesztők számára, hogy szinte bármilyen eszközhöz vagy platformhoz hozzáadjanak OCR-funkciót, beleértve a netbookokat, mini PC-ket vagy akár belépő szintű okostelefonokat is.

A Pythonhoz készült Aspose.OCR Cloud SDK egyszerű és könnyen kezelhető. A funkciók széles skáláját kínálja, amelyek ideális OCR-megoldássá teszik a Python-nal dolgozó fejlesztők számára, mint például egy teljes kép elolvasása, egy beolvasott PDF-dokumentum elolvasása, szöveg kinyerése a kép egy adott régiójából, adatok kinyerése beolvasott vagy fényképezett képből. nyugta, PDF-felismerési eredmények lekérése, szöveg kinyerése beolvasott vagy fényképezett táblázatokból, a felismerési eredmények természetes emberi hanggá alakítása és még sok más.

Az Aspose.OCR Cloud SDK for Python az Aspose.OCR Cloud API-ra épül, egy felhő alapú OCR motor, amely 45 felismerési nyelvet támogat, beleértve az angol, francia, német, spanyol, kínai, japán, arabot és sok más. Az OCR SDK használatával a Python programozók könnyedén integrálhatják az OCR-funkciókat Python-alkalmazásaikba anélkül, hogy aggódniuk kellene az OCR technológia bonyolultsága miatt. Az SDK egyszerű és intuitív kezelőfelületet biztosít, amely lehetővé teszi a felhasználók számára, hogy néhány sornyi kóddal képeket töltsenek fel, OCR-t hajtsanak végre és szöveget kérjenek le. Ha OCR-funkciót kell hozzáadnia Python-alkalmazásaihoz, az Aspose.OCR Cloud SDK-t Pythonhoz mindenképpen érdemes megnézni.

Previous Next

Kezdő lépések az Aspose.OCR Cloud SDK for Python használatával

Az Aspose.OCR Cloud SDK for Python telepítésének javasolt módja a pip használata. Kérjük, használja a következő parancsot a zökkenőmentes telepítés érdekében.

Az Aspose.OCR Cloud SDK for Python telepítése pip segítségével

 pip install aspose-ocr-cloud

Az SDK közvetlenül letölthető az Aspose.OCR Python Cloud SDK termékoldaláról

Képfelismerés Python-alkalmazásokkal

Az Aspose.OCR Cloud SDK for Python lehetővé teszi a szoftverfejlesztők számára, hogy OCR műveleteket hajtsanak végre a képfelismerés érdekében saját Python-alkalmazásaikon belül. Az API használata nagyon egyszerű, és a képfelismerés bármilyen internet-hozzáféréssel rendelkező platformról elvégezhető. Az OCR REST API segítségével egyszerűen kiválaszthatja és elküldheti a képeket felismerés céljából, lekérheti az eredményeket, és tárolhatja azokat bármely támogatott fájlformátumban, mindössze néhány sornyi kóddal. A következő példa bemutatja, hogyan hajtható végre az OCR művelet Python kóddal a képeken.

OCR végrehajtása egy képen a Python Appsben

import asposeocrcloud

# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')

# read the image file
with open('image.jpg', 'rb') as image_file:
    image_data = image_file.read()

# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)

# print the extracted text
print(result.text)

Szöveg kibontása PDF-fájlokból Python API-n keresztül

A Portable Document Format (PDF) a világ egyik legnépszerűbb üzleti dokumentumfájl-formátuma, és az Adobe által 1992-ben dokumentumok bemutatására kifejlesztett fájlformátum. Az Aspose.OCR Cloud SDK for Python tartalmaz egy nagyon hatékony funkciót a Python-alkalmazásokon belüli PDF-fájlok szövegének kinyerésére. A feladat egyszerű végrehajtásához fel kell töltenie a PDF fájlt az Aspose felhőtárhelyére, és el kell végeznie az OCR felismerést a feltöltött PDF fájlon. A következő példa bemutatja, hogyan tudnak a szoftverfejlesztők szöveget kivonni egy PDF-fájlból Python-kóddal.

Hogyan lehet szöveget kivonni egy PDF-fájlból Python API-n keresztül?

import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration

configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))

# Upload the PDF file to the Aspose cloud storage

with open('your_pdf_file.pdf', 'rb') as file:
    api.upload_file(path='your_pdf_file.pdf', file=file)

# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')

# Story the recognized text

recognized_text = result['text']
print(recognized_text)

Szöveg átalakítása beszédté a Python API-n keresztül

Az Aspose.OCR Cloud SDK for Python lehetővé teszi a szoftverfejlesztők számára, hogy szöveget képből konvertáljanak harmadik féltől származó szoftverek telepítése nélkül. Az API segítségével a programozók a felismerési eredményeket természetes emberi hanggá alakíthatják, amely lejátszható a háttérben vagy letölthető. A felhasználónak először el kell küldenie a képet az Aspose OCR Cloud szerverre, és ki kell bontania belőle szöveget, majd a szöveget beszéddé kell konvertálnia az Aspose OCR Cloud Text-to-Speech API segítségével. A sikeres átalakítás után a beszédfájlt lemezre mentheti.

Hogyan lehet szöveget beszédté alakítani a Python API segítségével?

 import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi

client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))

# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
    response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)

# Extract the recognized text

text = ''
for result in response.parts:
    for line in result.lines:
        for word in line.words:
            text += word.text + ' '

# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')

# Save the speech file to disk

with open('output.wav', 'wb') as file:
    file.write(response.content)

 Magyar