Aspose.OCR Cloud SDK for Python

Python OCR API ที่ดีที่สุดในการอ่านและแยกข้อความรูปภาพ

เพิ่มฟังก์ชัน OCR ให้กับแอป Python ผ่าน OCR API ช่วยให้สามารถอ่านและแยกข้อความจากรูปภาพ รูปภาพ ภาพหน้าจอ เอกสารที่สแกน และไฟล์ PDF ผ่านไลบรารี Python OCR

Aspose.OCR Cloud SDK สำหรับ Python เป็นโซลูชันการรู้จำอักขระด้วยแสง (OCR) ขั้นสูงและยืดหยุ่น ซึ่งช่วยให้นักพัฒนาซอฟต์แวร์สามารถสร้างแอปพลิเคชัน OCR โดยไม่ต้องพึ่งพาภายนอก ช่วยให้นักพัฒนาซอฟต์แวร์สามารถอ่านและแยกข้อความจากรูปภาพ ภาพถ่าย ภาพหน้าจอ เอกสารที่สแกน และ PDF ในสคริปต์ยุโรป ซีริลลิก และตะวันออกจำนวนมาก โดยให้ผลลัพธ์ในรูปแบบเอกสารที่ได้รับความนิยมมากที่สุด API ช่วยให้นักพัฒนาเพิ่มฟังก์ชัน OCR ลงในอุปกรณ์หรือแพลตฟอร์มเกือบทุกชนิดได้อย่างง่ายดาย รวมถึงเน็ตบุ๊ก มินิพีซี หรือแม้แต่สมาร์ทโฟนระดับเริ่มต้น

Aspose.OCR Cloud SDK สำหรับ Python นั้นตรงไปตรงมาและจัดการได้ง่าย โดยนำเสนอคุณสมบัติที่หลากหลายซึ่งทำให้เป็นโซลูชัน OCR ในอุดมคติสำหรับนักพัฒนาที่ทำงานกับ Python เช่น การอ่านรูปภาพทั้งหมด การอ่านเอกสาร PDF ที่สแกน การแยกข้อความจากบริเวณเฉพาะของรูปภาพ การแยกข้อมูลจากการสแกนหรือภาพถ่าย ใบเสร็จรับเงิน, ดึงผลการรู้จำ PDF, แยกข้อความจากตารางที่สแกนหรือรูปถ่าย, แปลงผลการรู้จำเป็นเสียงของมนุษย์ที่เป็นธรรมชาติ และอื่นๆ อีกมากมาย

Aspose.OCR Cloud SDK สำหรับ Python สร้างขึ้นจาก Aspose.OCR Cloud API ซึ่งเป็นกลไก OCR บนคลาวด์ที่รองรับภาษาการจดจำ 45 ภาษา รวมถึงภาษาอังกฤษ ฝรั่งเศส เยอรมัน สเปน จีน ญี่ปุ่น อาหรับ และ อื่น ๆ อีกมากมาย. เมื่อใช้ OCR SDK โปรแกรมเมอร์ Python สามารถรวมฟังก์ชัน OCR เข้ากับแอปพลิเคชัน Python ได้อย่างง่ายดายโดยไม่ต้องกังวลกับความซับซ้อนของเทคโนโลยี OCR SDK มีอินเทอร์เฟซที่เรียบง่ายและใช้งานง่ายซึ่งช่วยให้ผู้ใช้สามารถอัปโหลดรูปภาพ ดำเนินการ OCR และดึงข้อความด้วยโค้ดเพียงไม่กี่บรรทัด หากคุณต้องการเพิ่มฟังก์ชัน OCR ให้กับแอปพลิเคชัน Python ของคุณ Aspose.OCR Cloud SDK สำหรับ Python คุ้มค่าที่จะลองใช้งานอย่างแน่นอน

โดยสรุป

ภาพรวมของ Aspose.OCR Cloud SDK สำหรับฟีเจอร์ Python

ภาพรวมคุณสมบัติ

ดำเนินการ OCR
เพิ่มความสามารถ OCR
จดจำข้อความรูปภาพ
แปลงรูปภาพข้อความ
ข้อความแบบอักษรที่รู้จัก
ค้นหา PDF
27 ภาษาที่ใช้จดจำ
สร้างแอป OCR
บันทึกลงในเบราว์เซอร์
แยกข้อความ
การสนับสนุนแบบมัลติเธรด

ภาพรวมคุณสมบัติ

จดจำภาพที่หมุน
ตัวกรองก่อนการประมวลผล
PDF เป็นรูปภาพ
จดจำตัวอักษรจีน
ตรวจจับแบบอักษรยอดนิยม
ประมวลผลภาพทั้งหมด
สนับสนุนภาพที่หมุนได้
การรับรู้เป็นชุด
เครื่องตรวจตัวสะกดในตัว
แยก PDF
PDF เป็น Excel
PDF เป็น SVG

Aspose.OCR Cloud SDK for Python

API รองรับรูปแบบ PDF เป็นหลัก แต่สามารถส่งออกเอกสาร PDF ไปเป็นรูปแบบอื่นได้หลายรูปแบบ

ผู้อ่าน

PDF, PDF/A, TEX, XPS, SVG

นักเขียน

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR Cloud SDK for Python

ความเป็นอิสระของแพลตฟอร์ม

Aspose.OCR Cloud SDK สำหรับ Python ทำงานร่วมกับภาษาการเขียนโปรแกรมที่ใช้ Python ได้

Python 4.5 ขึ้นไป

Aspose.OCR Cloud SDK for Python

การเริ่มต้นใช้งาน Aspose.OCR Cloud SDK สำหรับ Python

วิธีแนะนำในการติดตั้ง Aspose.OCR Cloud SDK สำหรับ Python คือการใช้ pip โปรดใช้คำสั่งต่อไปนี้เพื่อการติดตั้งที่ราบรื่น

ติดตั้ง Aspose.OCR Cloud SDK สำหรับ Python ผ่าน pip

 pip install aspose-ocr-cloud

คุณสามารถดาวน์โหลด SDK ได้โดยตรงจากหน้าผลิตภัณฑ์Aspose.OCR Python Cloud SDK

การจดจำรูปภาพโดยใช้แอป Python

Aspose.OCR Cloud SDK สำหรับ Python ช่วยให้นักพัฒนาซอฟต์แวร์สามารถดำเนินการ OCR เพื่อให้ได้รับการจดจำรูปภาพภายในแอปพลิเคชัน Python ของตนเอง API นี้ใช้งานง่ายมาก และสามารถจดจำรูปภาพได้จากทุกแพลตฟอร์มที่มีอินเทอร์เน็ต คุณสามารถใช้ OCR REST API เพื่อเลือกและส่งรูปภาพเพื่อการจดจำ ดึงผลลัพธ์ และจัดเก็บในรูปแบบไฟล์ที่รองรับด้วยโค้ดเพียงไม่กี่บรรทัด ตัวอย่างต่อไปนี้แสดงวิธีดำเนินการ OCR บนรูปภาพโดยใช้โค้ด Python

ดำเนินการ OCR บนรูปภาพภายในแอป Python

import asposeocrcloud

# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')

# read the image file
with open('image.jpg', 'rb') as image_file:
    image_data = image_file.read()

# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)

# print the extracted text
print(result.text)

แยกข้อความจากไฟล์ PDF ผ่าน Python API

Portable Document Format (PDF) เป็นหนึ่งในรูปแบบไฟล์เอกสารทางธุรกิจที่ได้รับความนิยมมากที่สุดในโลก และเป็นรูปแบบไฟล์ที่พัฒนาโดย Adobe ในปี 1992 เพื่อนำเสนอเอกสาร Aspose.OCR Cloud SDK สำหรับ Python ได้รวมคุณสมบัติที่มีประสิทธิภาพมากสำหรับการแยกข้อความจากไฟล์ PDF ภายในแอปพลิเคชัน Python เพื่อให้บรรลุภารกิจด้วยวิธีง่ายๆ คุณต้องอัปโหลดไฟล์ PDF ไปยังที่จัดเก็บข้อมูลบนคลาวด์ของ Aspose และดำเนินการจดจำ OCR ในไฟล์ PDF ที่อัปโหลด ตัวอย่างต่อไปนี้แสดงวิธีที่นักพัฒนาซอฟต์แวร์สามารถแยกข้อความจากไฟล์ PDF โดยใช้โค้ด Python

จะแยกข้อความจากไฟล์ PDF ผ่าน Python API ได้อย่างไร

import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration

configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))

# Upload the PDF file to the Aspose cloud storage

with open('your_pdf_file.pdf', 'rb') as file:
    api.upload_file(path='your_pdf_file.pdf', file=file)

# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')

# Story the recognized text

recognized_text = result['text']
print(recognized_text)

แปลงข้อความเป็นคำพูดผ่าน Python API

Aspose.OCR Cloud SDK สำหรับ Python ช่วยให้นักพัฒนาซอฟต์แวร์สามารถแปลงข้อความจากรูปภาพโดยไม่ต้องติดตั้งซอฟต์แวร์ของบริษัทอื่น เมื่อใช้ API โปรแกรมเมอร์สามารถแปลงผลลัพธ์การจดจำให้เป็นเสียงมนุษย์ที่เป็นธรรมชาติซึ่งสามารถเล่นในพื้นหลังหรือดาวน์โหลดได้ ผู้ใช้รายแรกจำเป็นต้องส่งรูปภาพไปยังเซิร์ฟเวอร์ Aspose OCR Cloud และแยกข้อความจากนั้น จากนั้นแปลงข้อความเป็นคำพูดโดยใช้ Aspose OCR Cloud Text-to-Speech API หลังจากการแปลงสำเร็จคุณสามารถบันทึกไฟล์คำพูดลงดิสก์ได้

จะแปลงข้อความเป็นคำพูดโดยใช้ Python API ได้อย่างไร

 import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi

client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))

# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
    response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)

# Extract the recognized text

text = ''
for result in response.parts:
    for line in result.lines:
        for word in line.words:
            text += word.text + ' '

# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')

# Save the speech file to disk

with open('output.wav', 'wb') as file:
    file.write(response.content)