Aspose.OCR Cloud SDK for Python

ה-API הטוב ביותר של Python OCR לקריאה וחילוץ של תמונות טקסט

הוסף פונקציונליות OCR לאפליקציות Python באמצעות OCR API. זה מאפשר לקרוא ולחלץ טקסט מתמונות, תמונות, צילומי מסך, מסמכים סרוקים וקבצי PDF באמצעות ספריית Python OCR.

Aspose.OCR Cloud SDK עבור Python הוא פתרון זיהוי תווים אופטי (OCR) מתקדם וגמיש המסייע למפתחי תוכנה ליצור יישומי OCR ללא כל תלות חיצונית. זה מאפשר למפתחי תוכנה לקרוא ולחלץ טקסט מתמונות, תמונות, צילומי מסך, מסמכים סרוקים וקובצי PDF במספר רב של סקריפטים אירופיים, קיריליים ומזרחיים, ולהחזיר תוצאות בפורמטים הפופולריים ביותר של מסמכים. ממשק ה-API מקל על מפתחים להוסיף פונקציונליות OCR כמעט לכל מכשיר או פלטפורמה, כולל נטבוקים, מחשבים קטנים, או אפילו סמארטפונים ברמת ההתחלה.

Aspose.OCR Cloud SDK עבור Python הוא פשוט וקל לטיפול. הוא מספק מגוון רחב של תכונות שהופכות אותו לפתרון OCR אידיאלי עבור מפתחים העובדים עם Python, כגון קריאת תמונה שלמה, קריאת מסמך PDF סרוק, חילוץ טקסט מאזור ספציפי בתמונה, חילוץ נתונים מתמונה סרוקה או מצולם קבלה, שליפת תוצאות זיהוי PDF, חילוץ טקסט מטבלאות סרוקות או מצולמות, המרת תוצאות הזיהוי לקול אנושי טבעי ועוד רבים נוספים.

Aspose.OCR Cloud SDK עבור Python בנויה על גבי Aspose.OCR Cloud API, הוא מנוע OCR מבוסס ענן התומך ב-45 שפות זיהוי כולל אנגלית, צרפתית, גרמנית, ספרדית, סינית, יפנית, ערבית ו עוד הרבה. באמצעות OCR SDK, מתכנתי Python יכולים לשלב בקלות פונקציונליות OCR ביישומי Python שלהם מבלי לדאוג למורכבות של טכנולוגיית OCR. ה-SDK מספק ממשק פשוט ואינטואיטיבי המאפשר למשתמשים להעלות תמונות, לבצע OCR ולאחזר טקסט בכמה שורות קוד בלבד. אם אתה צריך להוסיף פונקציונליות OCR ליישומי Python שלך, ה-Aspose.OCR Cloud SDK עבור Python בהחלט שווה בדיקה.

במבט אחד

סקירה כללית של Aspose.OCR Cloud SDK עבור תכונות Python.

סקירת תכונות

בצע OCR
הוסף יכולות OCR
זהה טקסט תמונה
המר תמונות של טקסט
טקסט גופן מזוהה
חפש PDF
27 שפות זיהוי
צור אפליקציות OCR
שמור בדפדפן
חלץ טקסט
תמיכה בריבוי-שרשורים

סקירת תכונות

זהה תמונה שסובבה
עיבוד מקדים של מסננים
PDF לתמונות
מזהה תווים צ'ינים
מזהה גופנים פופולריים
מעבד את התמונה השלמה
תמיכה בתמונות מסובבות
זיהוי אצווה
בודק איות מובנה
פיצול PDF
PDF ל-Excel
PDF ל-SVG

Aspose.OCR Cloud SDK for Python

API תומך בעיקר בפורמט PDF אך יכול לייצא מסמכי PDF למספר פורמטים אחרים.

קוֹרֵא

PDF, PDF/A, TEX, XPS, SVG

סוֹפֵר

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR Cloud SDK for Python

עצמאות פלטפורמה

Aspose.OCR Cloud SDK עבור Python יכול לעבוד עם כל שפת תכנות מבוססת Python.

Python 4.5 ומעלה.

Aspose.OCR Cloud SDK for Python

תחילת העבודה עם Aspose.OCR Cloud SDK עבור Python

הדרך המומלצת להתקנת Aspose.OCR Cloud SDK עבור Python היא באמצעות pip. אנא השתמש בפקודה הבאה להתקנה חלקה.

התקן את Aspose.OCR Cloud SDK עבור Python באמצעות pip

 pip install aspose-ocr-cloud

תוכל להוריד את ה-SDK ישירות מדף המוצר Aspose.OCR Python Cloud SDK

זיהוי תמונות באמצעות אפליקציות Python

Aspose.OCR Cloud SDK עבור Python מאפשר למפתחי תוכנה לבצע פעולת OCR כדי להשיג זיהוי תמונה בתוך יישומי Python שלהם. ה-API קל מאוד לשימוש וניתן לבצע זיהוי תמונות מכל פלטפורמה עם גישה לאינטרנט. אתה יכול בקלות להשתמש ב- OCR REST API כדי לבחור ולשלוח תמונות לזיהוי, להביא תוצאות ולאחסן אותן בכל פורמט קובץ נתמך עם כמה שורות קוד בלבד. הדוגמה הבאה מראה כיצד לבצע פעולת OCR בתמונות באמצעות קוד Python.

בצע OCR על תמונה בתוך Python Apps

import asposeocrcloud

# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')

# read the image file
with open('image.jpg', 'rb') as image_file:
    image_data = image_file.read()

# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)

# print the extracted text
print(result.text)

חלץ טקסט מקובצי PDF באמצעות Python API

פורמט מסמכים ניידים (PDF) הוא אחד הפורמטים הפופולריים ביותר בעולם של מסמכים עסקיים והוא פורמט קובץ שפותח על ידי Adobe בשנת 1992 כדי להציג מסמכים. Aspose.OCR Cloud SDK עבור Python כללה תכונה חזקה מאוד לחילוץ טקסט מקובצי PDF בתוך יישומי Python. כדי להשיג את המשימה בצורה קלה עליך להעלות את קובץ ה-PDF לאחסון הענן של Aspose ולבצע את זיהוי ה-OCR בקובץ ה-PDF שהועלה. הדוגמה הבאה מראה כיצד מפתחי תוכנה יכולים לחלץ טקסט מקובץ PDF באמצעות קוד Python.

כיצד לחלץ טקסט מקובץ PDF באמצעות Python API?

import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration

configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))

# Upload the PDF file to the Aspose cloud storage

with open('your_pdf_file.pdf', 'rb') as file:
    api.upload_file(path='your_pdf_file.pdf', file=file)

# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')

# Story the recognized text

recognized_text = result['text']
print(recognized_text)

המר טקסט לדיבור באמצעות Python API

Aspose.OCR Cloud SDK עבור Python מאפשר למפתחי תוכנה להמיר טקסט מתמונה מבלי להתקין תוכנת צד שלישי. באמצעות ה-API, מתכנתים יכולים להמיר את תוצאות הזיהוי לקול אנושי טבעי שניתן לנגן ברקע או להוריד. צורך ראשון של המשתמש לשלוח את התמונה לשרת Aspose OCR Cloud ולחלץ ממנו טקסט ולאחר מכן להמיר את הטקסט לדיבור באמצעות Aspose OCR Cloud Text-to-Speech API. לאחר ההמרה המוצלחת ניתן לשמור את קובץ הדיבור בדיסק.

כיצד להמיר טקסט לדיבור באמצעות Python API?

 import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi

client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))

# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
    response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)

# Extract the recognized text

text = ''
for result in response.parts:
    for line in result.lines:
        for word in line.words:
            text += word.text + ' '

# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')

# Save the speech file to disk

with open('output.wav', 'wb') as file:
    file.write(response.content)