Aspose.OCR Cloud SDK for Python
Python OCR API ที่ดีที่สุดในการอ่านและแยกข้อความรูปภาพ
เพิ่มฟังก์ชัน OCR ให้กับแอป Python ผ่าน OCR API ช่วยให้สามารถอ่านและแยกข้อความจากรูปภาพ รูปภาพ ภาพหน้าจอ เอกสารที่สแกน และไฟล์ PDF ผ่านไลบรารี Python OCR
Aspose.OCR Cloud SDK สำหรับ Python เป็นโซลูชันการรู้จำอักขระด้วยแสง (OCR) ขั้นสูงและยืดหยุ่น ซึ่งช่วยให้นักพัฒนาซอฟต์แวร์สามารถสร้างแอปพลิเคชัน OCR โดยไม่ต้องพึ่งพาภายนอก ช่วยให้นักพัฒนาซอฟต์แวร์สามารถอ่านและแยกข้อความจากรูปภาพ ภาพถ่าย ภาพหน้าจอ เอกสารที่สแกน และ PDF ในสคริปต์ยุโรป ซีริลลิก และตะวันออกจำนวนมาก โดยให้ผลลัพธ์ในรูปแบบเอกสารที่ได้รับความนิยมมากที่สุด API ช่วยให้นักพัฒนาเพิ่มฟังก์ชัน OCR ลงในอุปกรณ์หรือแพลตฟอร์มเกือบทุกชนิดได้อย่างง่ายดาย รวมถึงเน็ตบุ๊ก มินิพีซี หรือแม้แต่สมาร์ทโฟนระดับเริ่มต้น
Aspose.OCR Cloud SDK สำหรับ Python นั้นตรงไปตรงมาและจัดการได้ง่าย โดยนำเสนอคุณสมบัติที่หลากหลายซึ่งทำให้เป็นโซลูชัน OCR ในอุดมคติสำหรับนักพัฒนาที่ทำงานกับ Python เช่น การอ่านรูปภาพทั้งหมด การอ่านเอกสาร PDF ที่สแกน การแยกข้อความจากบริเวณเฉพาะของรูปภาพ การแยกข้อมูลจากการสแกนหรือภาพถ่าย ใบเสร็จรับเงิน, ดึงผลการรู้จำ PDF, แยกข้อความจากตารางที่สแกนหรือรูปถ่าย, แปลงผลการรู้จำเป็นเสียงของมนุษย์ที่เป็นธรรมชาติ และอื่นๆ อีกมากมาย
Aspose.OCR Cloud SDK สำหรับ Python สร้างขึ้นจาก Aspose.OCR Cloud API ซึ่งเป็นกลไก OCR บนคลาวด์ที่รองรับภาษาการจดจำ 45 ภาษา รวมถึงภาษาอังกฤษ ฝรั่งเศส เยอรมัน สเปน จีน ญี่ปุ่น อาหรับ และ อื่น ๆ อีกมากมาย. เมื่อใช้ OCR SDK โปรแกรมเมอร์ Python สามารถรวมฟังก์ชัน OCR เข้ากับแอปพลิเคชัน Python ได้อย่างง่ายดายโดยไม่ต้องกังวลกับความซับซ้อนของเทคโนโลยี OCR SDK มีอินเทอร์เฟซที่เรียบง่ายและใช้งานง่ายซึ่งช่วยให้ผู้ใช้สามารถอัปโหลดรูปภาพ ดำเนินการ OCR และดึงข้อความด้วยโค้ดเพียงไม่กี่บรรทัด หากคุณต้องการเพิ่มฟังก์ชัน OCR ให้กับแอปพลิเคชัน Python ของคุณ Aspose.OCR Cloud SDK สำหรับ Python คุ้มค่าที่จะลองใช้งานอย่างแน่นอน
การเริ่มต้นใช้งาน Aspose.OCR Cloud SDK สำหรับ Python
วิธีแนะนำในการติดตั้ง Aspose.OCR Cloud SDK สำหรับ Python คือการใช้ pip โปรดใช้คำสั่งต่อไปนี้เพื่อการติดตั้งที่ราบรื่น
ติดตั้ง Aspose.OCR Cloud SDK สำหรับ Python ผ่าน pip
pip install aspose-ocr-cloud
คุณสามารถดาวน์โหลด SDK ได้โดยตรงจากหน้าผลิตภัณฑ์Aspose.OCR Python Cloud SDK
การจดจำรูปภาพโดยใช้แอป Python
Aspose.OCR Cloud SDK สำหรับ Python ช่วยให้นักพัฒนาซอฟต์แวร์สามารถดำเนินการ OCR เพื่อให้ได้รับการจดจำรูปภาพภายในแอปพลิเคชัน Python ของตนเอง API นี้ใช้งานง่ายมาก และสามารถจดจำรูปภาพได้จากทุกแพลตฟอร์มที่มีอินเทอร์เน็ต คุณสามารถใช้ OCR REST API เพื่อเลือกและส่งรูปภาพเพื่อการจดจำ ดึงผลลัพธ์ และจัดเก็บในรูปแบบไฟล์ที่รองรับด้วยโค้ดเพียงไม่กี่บรรทัด ตัวอย่างต่อไปนี้แสดงวิธีดำเนินการ OCR บนรูปภาพโดยใช้โค้ด Python
ดำเนินการ OCR บนรูปภาพภายในแอป Python
import asposeocrcloud
# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')
# read the image file
with open('image.jpg', 'rb') as image_file:
image_data = image_file.read()
# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)
# print the extracted text
print(result.text)
แยกข้อความจากไฟล์ PDF ผ่าน Python API
Portable Document Format (PDF) เป็นหนึ่งในรูปแบบไฟล์เอกสารทางธุรกิจที่ได้รับความนิยมมากที่สุดในโลก และเป็นรูปแบบไฟล์ที่พัฒนาโดย Adobe ในปี 1992 เพื่อนำเสนอเอกสาร Aspose.OCR Cloud SDK สำหรับ Python ได้รวมคุณสมบัติที่มีประสิทธิภาพมากสำหรับการแยกข้อความจากไฟล์ PDF ภายในแอปพลิเคชัน Python เพื่อให้บรรลุภารกิจด้วยวิธีง่ายๆ คุณต้องอัปโหลดไฟล์ PDF ไปยังที่จัดเก็บข้อมูลบนคลาวด์ของ Aspose และดำเนินการจดจำ OCR ในไฟล์ PDF ที่อัปโหลด ตัวอย่างต่อไปนี้แสดงวิธีที่นักพัฒนาซอฟต์แวร์สามารถแยกข้อความจากไฟล์ PDF โดยใช้โค้ด Python
จะแยกข้อความจากไฟล์ PDF ผ่าน Python API ได้อย่างไร
import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration
configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))
# Upload the PDF file to the Aspose cloud storage
with open('your_pdf_file.pdf', 'rb') as file:
api.upload_file(path='your_pdf_file.pdf', file=file)
# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')
# Story the recognized text
recognized_text = result['text']
print(recognized_text)
แปลงข้อความเป็นคำพูดผ่าน Python API
Aspose.OCR Cloud SDK สำหรับ Python ช่วยให้นักพัฒนาซอฟต์แวร์สามารถแปลงข้อความจากรูปภาพโดยไม่ต้องติดตั้งซอฟต์แวร์ของบริษัทอื่น เมื่อใช้ API โปรแกรมเมอร์สามารถแปลงผลลัพธ์การจดจำให้เป็นเสียงมนุษย์ที่เป็นธรรมชาติซึ่งสามารถเล่นในพื้นหลังหรือดาวน์โหลดได้ ผู้ใช้รายแรกจำเป็นต้องส่งรูปภาพไปยังเซิร์ฟเวอร์ Aspose OCR Cloud และแยกข้อความจากนั้น จากนั้นแปลงข้อความเป็นคำพูดโดยใช้ Aspose OCR Cloud Text-to-Speech API หลังจากการแปลงสำเร็จคุณสามารถบันทึกไฟล์คำพูดลงดิสก์ได้
จะแปลงข้อความเป็นคำพูดโดยใช้ Python API ได้อย่างไร
import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi
client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))
# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)
# Extract the recognized text
text = ''
for result in response.parts:
for line in result.lines:
for word in line.words:
text += word.text + ' '
# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')
# Save the speech file to disk
with open('output.wav', 'wb') as file:
file.write(response.content)