Aspose.OCR Cloud SDK for Python

A legjobb Python OCR API a képek szövegének olvasásához és kibontásához

Adja hozzá az OCR-funkciókat a Python-alkalmazásokhoz az OCR API-n keresztül. Lehetővé teszi a képek, fényképek, képernyőképek, szkennelt dokumentumok és PDF-fájlok szövegének olvasását és kibontását a Python OCR Library segítségével.

Az Aspose.OCR Cloud SDK for Python egy fejlett és rugalmas optikai karakterfelismerő (OCR) megoldás, amely segít a szoftverfejlesztőknek OCR-alkalmazások létrehozásában külső függőségek nélkül. Lehetővé teszi a szoftverfejlesztők számára, hogy szöveget olvassanak és bontsanak ki képekből, fényképekből, képernyőképekből, beszkennelt dokumentumokból és PDF-fájlokból számos európai, cirill és keleti szkriptben, így a legnépszerűbb dokumentumformátumokban adják vissza az eredményeket. Az API megkönnyíti a fejlesztők számára, hogy szinte bármilyen eszközhöz vagy platformhoz hozzáadjanak OCR-funkciót, beleértve a netbookokat, mini PC-ket vagy akár belépő szintű okostelefonokat is.

A Pythonhoz készült Aspose.OCR Cloud SDK egyszerű és könnyen kezelhető. A funkciók széles skáláját kínálja, amelyek ideális OCR-megoldássá teszik a Python-nal dolgozó fejlesztők számára, mint például egy teljes kép elolvasása, egy beolvasott PDF-dokumentum elolvasása, szöveg kinyerése a kép egy adott régiójából, adatok kinyerése beolvasott vagy fényképezett képből. nyugta, PDF-felismerési eredmények lekérése, szöveg kinyerése beolvasott vagy fényképezett táblázatokból, a felismerési eredmények természetes emberi hanggá alakítása és még sok más.

Az Aspose.OCR Cloud SDK for Python az Aspose.OCR Cloud API-ra épül, egy felhő alapú OCR motor, amely 45 felismerési nyelvet támogat, beleértve az angol, francia, német, spanyol, kínai, japán, arabot és sok más. Az OCR SDK használatával a Python programozók könnyedén integrálhatják az OCR-funkciókat Python-alkalmazásaikba anélkül, hogy aggódniuk kellene az OCR technológia bonyolultsága miatt. Az SDK egyszerű és intuitív kezelőfelületet biztosít, amely lehetővé teszi a felhasználók számára, hogy néhány sornyi kóddal képeket töltsenek fel, OCR-t hajtsanak végre és szöveget kérjenek le. Ha OCR-funkciót kell hozzáadnia Python-alkalmazásaihoz, az Aspose.OCR Cloud SDK-t Pythonhoz mindenképpen érdemes megnézni.

Első pillantásra

Az Aspose.OCR Cloud SDK Python szolgáltatásainak áttekintése.

Jellemzők áttekintése

Végezze el az OCR-t
OCR képességek hozzáadása
A kép szövegének felismerése
Szövegképek beépítése
Felismert betűtípus szövege
PDF keresése
27 felismerési nyelv
OCR-alkalmazások létrehozása
Mentés böngészőbe
Szöveg kibontása
Többszálú támogatás

Jellemzők áttekintése

Az elforgatott kép felismerése
Szűrők előfeldolgozása
PDF-ből képek
Felismeri a Chines karaktereket
Érzékeli a népszerű betűtípusokat
A teljes képet feldolgozza
Elforgatott képek támogatása
Kötegelt felismerés
Beépített helyesírás-ellenőrző
PDF felosztása
PDF-ből Excelbe
PDF-ből SVG-be

Aspose.OCR Cloud SDK for Python

Az API főként a PDF formátumot támogatja, de számos más formátumba is exportálhat PDF dokumentumokat.

Olvasó

PDF, PDF/A, TEX, XPS, SVG

Író

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR Cloud SDK for Python

Platformfüggetlenség

Az Aspose.OCR Cloud SDK for Python bármely Python-alapú programozási nyelvvel működik.

Python 4.5 és újabb.

Aspose.OCR Cloud SDK for Python

Kezdő lépések az Aspose.OCR Cloud SDK for Python használatával

Az Aspose.OCR Cloud SDK for Python telepítésének javasolt módja a pip használata. Kérjük, használja a következő parancsot a zökkenőmentes telepítés érdekében.

Az Aspose.OCR Cloud SDK for Python telepítése pip segítségével

 pip install aspose-ocr-cloud

Az SDK közvetlenül letölthető az Aspose.OCR Python Cloud SDK termékoldaláról

Képfelismerés Python-alkalmazásokkal

Az Aspose.OCR Cloud SDK for Python lehetővé teszi a szoftverfejlesztők számára, hogy OCR műveleteket hajtsanak végre a képfelismerés érdekében saját Python-alkalmazásaikon belül. Az API használata nagyon egyszerű, és a képfelismerés bármilyen internet-hozzáféréssel rendelkező platformról elvégezhető. Az OCR REST API segítségével egyszerűen kiválaszthatja és elküldheti a képeket felismerés céljából, lekérheti az eredményeket, és tárolhatja azokat bármely támogatott fájlformátumban, mindössze néhány sornyi kóddal. A következő példa bemutatja, hogyan hajtható végre az OCR művelet Python kóddal a képeken.

OCR végrehajtása egy képen a Python Appsben

import asposeocrcloud

# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')

# read the image file
with open('image.jpg', 'rb') as image_file:
    image_data = image_file.read()

# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)

# print the extracted text
print(result.text)

Szöveg kibontása PDF-fájlokból Python API-n keresztül

A Portable Document Format (PDF) a világ egyik legnépszerűbb üzleti dokumentumfájl-formátuma, és az Adobe által 1992-ben dokumentumok bemutatására kifejlesztett fájlformátum. Az Aspose.OCR Cloud SDK for Python tartalmaz egy nagyon hatékony funkciót a Python-alkalmazásokon belüli PDF-fájlok szövegének kinyerésére. A feladat egyszerű végrehajtásához fel kell töltenie a PDF fájlt az Aspose felhőtárhelyére, és el kell végeznie az OCR felismerést a feltöltött PDF fájlon. A következő példa bemutatja, hogyan tudnak a szoftverfejlesztők szöveget kivonni egy PDF-fájlból Python-kóddal.

Hogyan lehet szöveget kivonni egy PDF-fájlból Python API-n keresztül?

import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration

configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))

# Upload the PDF file to the Aspose cloud storage

with open('your_pdf_file.pdf', 'rb') as file:
    api.upload_file(path='your_pdf_file.pdf', file=file)

# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')

# Story the recognized text

recognized_text = result['text']
print(recognized_text)

Szöveg átalakítása beszédté a Python API-n keresztül

Az Aspose.OCR Cloud SDK for Python lehetővé teszi a szoftverfejlesztők számára, hogy szöveget képből konvertáljanak harmadik féltől származó szoftverek telepítése nélkül. Az API segítségével a programozók a felismerési eredményeket természetes emberi hanggá alakíthatják, amely lejátszható a háttérben vagy letölthető. A felhasználónak először el kell küldenie a képet az Aspose OCR Cloud szerverre, és ki kell bontania belőle szöveget, majd a szöveget beszéddé kell konvertálnia az Aspose OCR Cloud Text-to-Speech API segítségével. A sikeres átalakítás után a beszédfájlt lemezre mentheti.

Hogyan lehet szöveget beszédté alakítani a Python API segítségével?

 import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi

client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))

# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
    response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)

# Extract the recognized text

text = ''
for result in response.parts:
    for line in result.lines:
        for word in line.words:
            text += word.text + ' '

# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')

# Save the speech file to disk

with open('output.wav', 'wb') as file:
    file.write(response.content)