Aspose.OCR Cloud SDK for Python

Beste Python OCR API for å lese og trekke ut bildetekst

Legg til OCR-funksjonalitet til Python-apper via OCR API. Den lar deg lese og trekke ut tekst fra bilder, bilder, skjermbilder, skannede dokumenter og PDF-filer via Python OCR Library.

Aspose.OCR Cloud SDK for Python er en avansert og fleksibel løsning for optisk tegngjenkjenning (OCR) som hjelper programvareutviklere med å lage OCR-applikasjoner uten eksterne avhengigheter. Den lar programvareutviklere lese og trekke ut tekst fra bilder, bilder, skjermbilder, skannede dokumenter og PDF-er i et stort antall europeiske, kyrilliske og østlige skript, og gir resultater i de mest populære dokumentformatene. API-en gjør det enkelt for utviklere å legge til OCR-funksjonalitet til nesten hvilken som helst enhet eller plattform, inkludert netbooks, mini-PC-er eller til og med smarttelefoner på startnivå.

Aspose.OCR Cloud SDK for Python er enkel og enkel å håndtere. Det gir et bredt spekter av funksjoner som gjør det til en ideell OCR-løsning for utviklere som arbeider med Python, for eksempel å lese et helt bilde, lese et skannet PDF-dokument, trekke ut tekst fra et bestemt område av bildet, trekke ut data fra et skannet eller fotografert kvittering, hente PDF-gjenkjenningsresultater, trekke ut tekst fra skannede eller fotograferte tabeller, konvertere gjenkjenningsresultatene til en naturlig menneskelig stemme og mye mer.

Aspose.OCR Cloud SDK for Python er bygget på toppen av Aspose.OCR Cloud API, er en skybasert OCR-motor som støtter 45 gjenkjenningsspråk, inkludert engelsk, fransk, tysk, spansk, kinesisk, japansk, arabisk og mange flere. Ved å bruke OCR SDK kan Python-programmerere enkelt integrere OCR-funksjonalitet i Python-applikasjonene sine uten å måtte bekymre seg for kompleksiteten til OCR-teknologi. SDK gir et enkelt og intuitivt grensesnitt som lar brukere laste opp bilder, utføre OCR og hente tekst på bare noen få linjer med kode. Hvis du trenger å legge til OCR-funksjonalitet til Python-applikasjonene dine, er Aspose.OCR Cloud SDK for Python definitivt verdt å sjekke ut.

Med et blikk

En oversikt over Aspose.OCR Cloud SDK for Python-funksjoner.

Oversikt over funksjoner

Utfør OCR
Legg til OCR-funksjoner
Gjenkjenne bildetekst
Konverter bilder av tekst
Gjenkjent skrifttekst
Søk i PDF
27 gjenkjenningsspråk
Lag OCR-apper
Lagre i nettleseren
Trekk ut tekst
Støtte for flere tråder

Oversikt over funksjoner

Gjenkjenn rotert bilde
Forbehandlingsfiltre
PDF til bilder
Gjenkjenner Chines Chars
Oppdager populære skrifttyper
Behandler hele bildet
Støtte for roterte bilder
Batchgjenkjenning
Innebygd stavekontroll
Del PDF
PDF til Excel
PDF til SVG

Aspose.OCR Cloud SDK for Python

API støtter hovedsakelig PDF-format, men kan eksportere PDF-dokumenter til en rekke andre formater.

Leser

PDF, PDF/A, TEX, XPS, SVG

Forfatter

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR Cloud SDK for Python

Plattformuavhengighet

Aspose.OCR Cloud SDK for Python kan fungere med alle Python-baserte programmeringsspråk.

Python 4.5 og nyere.

Aspose.OCR Cloud SDK for Python

Kom i gang med Aspose.OCR Cloud SDK for Python

Den anbefalte måten å installere Aspose.OCR Cloud SDK for Python på er å bruke pip. Bruk følgende kommando for en jevn installasjon.

Installer Aspose.OCR Cloud SDK for Python via pip

 pip install aspose-ocr-cloud

Du kan laste ned SDK-en direkte fra Aspose.OCR Python Cloud SDK-produktsiden

Bildegjenkjenning ved hjelp av Python-apper

Aspose.OCR Cloud SDK for Python lar programvareutviklere utføre OCR-operasjoner for å oppnå bildegjenkjenning i sine egne Python-applikasjoner. API-en er veldig enkel å bruke og bildegjenkjenning kan utføres fra enhver plattform med Internett-tilgang. Du kan enkelt bruke OCR REST API til å velge og sende bilder for gjenkjenning, hente resultater og lagre det i alle støttede filformater med bare et par linjer med kode. Følgende eksempel viser hvordan du utfører OCR-operasjon på bilder ved hjelp av Python-kode.

Utfør OCR på et bilde i Python Apps

import asposeocrcloud

# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')

# read the image file
with open('image.jpg', 'rb') as image_file:
    image_data = image_file.read()

# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)

# print the extracted text
print(result.text)

trekk ut tekst fra PDF-filer via Python API

Portable Document Format (PDF) er et av verdens mest populære filformater for forretningsdokumenter og er et filformat utviklet av Adobe i 1992 for å presentere dokumenter. Aspose.OCR Cloud SDK for Python har inkludert en veldig kraftig funksjon for å trekke ut tekst fra PDF-filer i Python-applikasjoner. For å oppnå oppgaven på en enkel måte må du laste opp PDF-filen til Aspose-skylagringen og utføre OCR-gjenkjenning på den opplastede PDF-filen. Følgende eksempel viser hvordan programvareutviklere kan trekke ut tekst fra en PDF-fil ved hjelp av Python-kode.

Hvordan trekke ut tekst fra en PDF-fil via Python API?

import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration

configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))

# Upload the PDF file to the Aspose cloud storage

with open('your_pdf_file.pdf', 'rb') as file:
    api.upload_file(path='your_pdf_file.pdf', file=file)

# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')

# Story the recognized text

recognized_text = result['text']
print(recognized_text)

Konverter tekst til tale via Python API

Aspose.OCR Cloud SDK for Python gjør det mulig for programvareutviklere å konvertere tekst fra bilde uten å installere tredjepartsprogramvare. Ved å bruke API kan programmerere konvertere gjenkjenningsresultatene til en naturlig menneskelig stemme som kan spilles av i bakgrunnen eller lastes ned. Første brukers behov for å sende bildet til Aspose OCR Cloud-server og trekke ut tekst fra den og deretter konvertere teksten til tale ved hjelp av Aspose OCR Cloud Text-to-Speech API. Etter vellykket konvertering kan du lagre talefilen på disk.

Hvordan konverterer du tekst til tale ved hjelp av Python API?

 import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi

client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))

# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
    response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)

# Extract the recognized text

text = ''
for result in response.parts:
    for line in result.lines:
        for word in line.words:
            text += word.text + ' '

# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')

# Save the speech file to disk

with open('output.wav', 'wb') as file:
    file.write(response.content)