Aspose.OCR Cloud SDK for Python
API OCR Python Terbaik untuk Membaca dan Mengekstrak Teks Imej
Tambahkan Fungsi OCR pada Apl Python melalui API OCR. Ia Membenarkan Membaca dan Mengekstrak teks daripada Imej, Foto, Tangkapan Skrin, Dokumen yang diimbas dan Fail PDF melalui Perpustakaan OCR Python.
Aspose.OCR Cloud SDK untuk Python ialah penyelesaian pengecaman aksara optik (OCR) lanjutan dan fleksibel yang membantu pembangun perisian untuk mencipta aplikasi OCR tanpa sebarang kebergantungan luaran. Ia membenarkan pembangun perisian membaca dan mengekstrak teks daripada imej, foto, tangkapan skrin, dokumen yang diimbas dan PDF dalam sejumlah besar skrip Eropah, Cyrillic dan Timur, mengembalikan hasil dalam format dokumen yang paling popular. API memudahkan pembangun menambahkan fungsi OCR pada hampir mana-mana peranti atau platform, termasuk netbook, PC mini atau telefon pintar peringkat permulaan.
Aspose.OCR Cloud SDK untuk Python adalah mudah dan mudah dikendalikan. Ia menyediakan pelbagai ciri yang menjadikannya penyelesaian OCR yang ideal untuk pembangun yang bekerja dengan Python, seperti membaca keseluruhan imej, membaca dokumen PDF yang diimbas, mengekstrak teks daripada kawasan tertentu imej, mengekstrak data daripada yang diimbas atau difoto. resit, mengambil hasil pengecaman PDF, mengekstrak teks daripada jadual yang diimbas atau bergambar, menukar hasil pengecaman kepada suara manusia semula jadi dan banyak lagi.
Aspose.OCR Cloud SDK untuk Python dibina di atas Aspose.OCR Cloud API, ialah enjin OCR berasaskan awan yang menyokong 45 bahasa pengecaman termasuk bahasa Inggeris, Perancis, Jerman, Sepanyol, Cina, Jepun, Arab dan banyak lagi. Menggunakan OCR SDK, pengaturcara Python boleh dengan mudah menyepadukan fungsi OCR ke dalam aplikasi Python mereka tanpa perlu risau tentang kerumitan teknologi OCR. SDK menyediakan antara muka yang mudah dan intuitif yang membolehkan pengguna memuat naik imej, melakukan OCR dan mendapatkan semula teks dalam beberapa baris kod sahaja. Jika anda perlu menambah kefungsian OCR pada aplikasi Python anda, Aspose.OCR Cloud SDK untuk Python pastinya berbaloi untuk dilihat.
Bermula dengan Aspose.OCR Cloud SDK untuk Python
Cara yang disyorkan untuk memasang Aspose.OCR Cloud SDK untuk Python menggunakan pip. Sila gunakan arahan berikut untuk pemasangan yang lancar.
Pasang Aspose.OCR Cloud SDK untuk Python melalui pip
pip install aspose-ocr-cloud
Anda boleh memuat turun SDK terus daripada Aspose.OCR Python Cloud SDK halaman produk
Pengecaman Imej menggunakan Apl Python
Aspose.OCR Cloud SDK untuk Python membenarkan pembangun perisian melaksanakan operasi OCR untuk mencapai pengecaman imej dalam aplikasi Python mereka sendiri. API ini sangat mudah digunakan dan pengecaman imej boleh dilakukan dari mana-mana platform dengan akses Internet. Anda boleh menggunakan API OCR REST dengan mudah untuk memilih dan menghantar imej untuk pengecaman, mengambil keputusan dan menyimpannya dalam sebarang format fail yang disokong dengan hanya beberapa baris kod. Contoh berikut menunjukkan cara melaksanakan operasi OCR pada imej menggunakan kod Python.
Lakukan OCR pada imej di dalam Apl Python
import asposeocrcloud
# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')
# read the image file
with open('image.jpg', 'rb') as image_file:
image_data = image_file.read()
# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)
# print the extracted text
print(result.text)
Ekstrak Teks daripada Fail PDF melalui Python API
Format Dokumen Mudah Alih (PDF) ialah salah satu format fail dokumen perniagaan yang paling popular di dunia dan merupakan format fail yang dibangunkan oleh Adobe pada tahun 1992 untuk membentangkan dokumen. Aspose.OCR Cloud SDK untuk Python telah menyertakan ciri yang sangat berkuasa untuk mengekstrak teks daripada fail PDF dalam aplikasi Python. Untuk mencapai tugas dengan cara yang mudah, anda perlu memuat naik fail PDF ke storan awan Aspose dan melaksanakan pengecaman OCR pada fail PDF yang dimuat naik. Contoh berikut menunjukkan cara pembangun perisian boleh mengekstrak teks daripada fail PDF menggunakan kod Python.
Bagaimana untuk Mengekstrak Teks daripada Fail PDF melalui Python API?
import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration
configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))
# Upload the PDF file to the Aspose cloud storage
with open('your_pdf_file.pdf', 'rb') as file:
api.upload_file(path='your_pdf_file.pdf', file=file)
# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')
# Story the recognized text
recognized_text = result['text']
print(recognized_text)
Tukar Teks kepada Pertuturan melalui API Python
Aspose.OCR Cloud SDK untuk Python membolehkan pembangun perisian menukar teks daripada imej tanpa memasang sebarang perisian pihak ketiga. Menggunakan API, pengaturcara boleh menukar hasil pengecaman kepada suara manusia semula jadi yang boleh dimainkan di latar belakang atau dimuat turun. Pengguna pertama perlu menghantar imej ke pelayan Aspose OCR Cloud dan mengekstrak teks daripadanya dan selepas itu menukar teks kepada pertuturan menggunakan Aspose OCR Cloud Text-to-Speech API. Selepas penukaran berjaya anda boleh menyimpan fail pertuturan ke cakera.
Bagaimana untuk Menukar Teks kepada Pertuturan menggunakan API Python?
import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi
client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))
# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)
# Extract the recognized text
text = ''
for result in response.parts:
for line in result.lines:
for word in line.words:
text += word.text + ' '
# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')
# Save the speech file to disk
with open('output.wav', 'wb') as file:
file.write(response.content)