1. Produk
  2.   OCR
  3.   Python
  4.   Aspose.OCR Cloud SDK for Python

Aspose.OCR Cloud SDK for Python

 
 

API Python OCR Terbaik untuk Membaca dan Mengekstrak Teks Gambar

Tambahkan Fungsi OCR ke Aplikasi Python melalui OCR API. Memungkinkan untuk Membaca dan Mengekstrak teks dari Gambar, Foto, Tangkapan Layar, dokumen yang dipindai, dan File PDF melalui Perpustakaan Python OCR.

Aspose.OCR Cloud SDK untuk Python adalah solusi pengenalan karakter optik (OCR) yang canggih dan fleksibel yang membantu pengembang perangkat lunak membuat aplikasi OCR tanpa ketergantungan eksternal apa pun. Hal ini memungkinkan pengembang perangkat lunak untuk membaca dan mengekstrak teks dari gambar, foto, tangkapan layar, dokumen yang dipindai, dan PDF dalam sejumlah besar skrip Eropa, Sirilik, dan Timur, memberikan hasil dalam format dokumen paling populer. API memudahkan pengembang untuk menambahkan fungsi OCR ke hampir semua perangkat atau platform, termasuk netbook, mini PC, atau bahkan ponsel cerdas tingkat pemula.

Aspose.OCR Cloud SDK untuk Python sederhana dan mudah digunakan. Ini menyediakan berbagai fitur yang menjadikannya solusi OCR ideal bagi pengembang yang bekerja dengan Python, seperti membaca seluruh gambar, membaca dokumen PDF yang dipindai, mengekstrak teks dari wilayah tertentu pada gambar, mengekstrak data dari gambar yang dipindai atau difoto. tanda terima, mengambil hasil pengenalan PDF, mengekstrak teks dari tabel yang dipindai atau difoto, mengubah hasil pengenalan menjadi suara manusia alami, dan masih banyak lagi.

Aspose.OCR Cloud SDK untuk Python dibangun di atas Aspose.OCR Cloud API, adalah mesin OCR berbasis cloud yang mendukung 45 bahasa pengenalan termasuk Inggris, Prancis, Jerman, Spanyol, China, Jepang, Arab, dan masih banyak lagi. Dengan menggunakan OCR SDK, pemrogram Python dapat dengan mudah mengintegrasikan fungsionalitas OCR ke dalam aplikasi Python mereka tanpa harus khawatir tentang kompleksitas teknologi OCR. SDK menyediakan antarmuka sederhana dan intuitif yang memungkinkan pengguna mengunggah gambar, melakukan OCR, dan mengambil teks hanya dalam beberapa baris kode. Jika Anda perlu menambahkan fungsionalitas OCR ke aplikasi Python Anda, Aspose.OCR Cloud SDK untuk Python layak untuk dicoba.

Previous Next

Memulai dengan Aspose.OCR Cloud SDK untuk Python

Cara yang disarankan untuk menginstal Aspose.OCR Cloud SDK untuk Python adalah menggunakan pip. Silakan gunakan perintah berikut untuk kelancaran instalasi.

Instal Aspose.OCR Cloud SDK untuk Python melalui pip

 pip install aspose-ocr-cloud

Anda dapat mendownload SDK langsung dari halaman produk Aspose.OCR Python Cloud SDK

Pengenalan Gambar menggunakan Aplikasi Python

Aspose.OCR Cloud SDK untuk Python memungkinkan pengembang perangkat lunak melakukan operasi OCR untuk mencapai pengenalan gambar di dalam aplikasi Python mereka sendiri. API ini sangat mudah digunakan dan pengenalan gambar dapat dilakukan dari platform apa pun dengan akses Internet. Anda dapat dengan mudah menggunakan OCR REST API untuk memilih dan mengirim gambar untuk dikenali, mengambil hasil, dan menyimpannya dalam format file apa pun yang didukung hanya dengan beberapa baris kode. Contoh berikut menunjukkan cara melakukan operasi OCR pada gambar menggunakan kode Python.

Lakukan OCR pada gambar di dalam Aplikasi Python

import asposeocrcloud

# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')

# read the image file
with open('image.jpg', 'rb') as image_file:
    image_data = image_file.read()

# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)

# print the extracted text
print(result.text)

Ekstrak Teks dari File PDF melalui Python API

Portable Document Format (PDF) adalah salah satu format file dokumen bisnis paling populer di dunia dan merupakan format file yang dikembangkan oleh Adobe pada tahun 1992 untuk menyajikan dokumen. Aspose.OCR Cloud SDK untuk Python telah menyertakan fitur yang sangat kuat untuk mengekstraksi teks dari file PDF di dalam aplikasi Python. Untuk menyelesaikan tugas dengan cara yang mudah, Anda perlu mengunggah file PDF ke penyimpanan cloud Aspose dan melakukan pengenalan OCR pada file PDF yang diunggah. Contoh berikut menunjukkan bagaimana pengembang perangkat lunak dapat mengekstrak teks dari file PDF menggunakan kode Python.

Bagaimana Cara Mengekstrak Teks dari File PDF melalui Python API?

import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration

configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))

# Upload the PDF file to the Aspose cloud storage

with open('your_pdf_file.pdf', 'rb') as file:
    api.upload_file(path='your_pdf_file.pdf', file=file)

# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')

# Story the recognized text

recognized_text = result['text']
print(recognized_text)

Konversi Teks ke Ucapan melalui Python API

Aspose.OCR Cloud SDK untuk Python memungkinkan pengembang perangkat lunak mengonversi teks dari gambar tanpa menginstal perangkat lunak pihak ketiga apa pun. Dengan menggunakan API, pemrogram dapat mengubah hasil pengenalan menjadi suara alami manusia yang dapat diputar di latar belakang atau diunduh. Kebutuhan pengguna pertama untuk mengirim gambar ke server Aspose OCR Cloud dan mengekstrak teks darinya dan setelah itu mengkonversi teks menjadi ucapan menggunakan Aspose OCR Cloud Text-to-Speech API. Setelah konversi berhasil, Anda dapat menyimpan file ucapan ke disk.

Bagaimana Mengonversi Teks ke Ucapan menggunakan Python API?

 import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi

client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))

# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
    response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)

# Extract the recognized text

text = ''
for result in response.parts:
    for line in result.lines:
        for word in line.words:
            text += word.text + ' '

# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')

# Save the speech file to disk

with open('output.wav', 'wb') as file:
    file.write(response.content)

 Indonesia