Aspose.OCR Cloud SDK for Python
ה-API הטוב ביותר של Python OCR לקריאה וחילוץ של תמונות טקסט
הוסף פונקציונליות OCR לאפליקציות Python באמצעות OCR API. זה מאפשר לקרוא ולחלץ טקסט מתמונות, תמונות, צילומי מסך, מסמכים סרוקים וקבצי PDF באמצעות ספריית Python OCR.
Aspose.OCR Cloud SDK עבור Python הוא פתרון זיהוי תווים אופטי (OCR) מתקדם וגמיש המסייע למפתחי תוכנה ליצור יישומי OCR ללא כל תלות חיצונית. זה מאפשר למפתחי תוכנה לקרוא ולחלץ טקסט מתמונות, תמונות, צילומי מסך, מסמכים סרוקים וקובצי PDF במספר רב של סקריפטים אירופיים, קיריליים ומזרחיים, ולהחזיר תוצאות בפורמטים הפופולריים ביותר של מסמכים. ממשק ה-API מקל על מפתחים להוסיף פונקציונליות OCR כמעט לכל מכשיר או פלטפורמה, כולל נטבוקים, מחשבים קטנים, או אפילו סמארטפונים ברמת ההתחלה.
Aspose.OCR Cloud SDK עבור Python הוא פשוט וקל לטיפול. הוא מספק מגוון רחב של תכונות שהופכות אותו לפתרון OCR אידיאלי עבור מפתחים העובדים עם Python, כגון קריאת תמונה שלמה, קריאת מסמך PDF סרוק, חילוץ טקסט מאזור ספציפי בתמונה, חילוץ נתונים מתמונה סרוקה או מצולם קבלה, שליפת תוצאות זיהוי PDF, חילוץ טקסט מטבלאות סרוקות או מצולמות, המרת תוצאות הזיהוי לקול אנושי טבעי ועוד רבים נוספים.
Aspose.OCR Cloud SDK עבור Python בנויה על גבי Aspose.OCR Cloud API, הוא מנוע OCR מבוסס ענן התומך ב-45 שפות זיהוי כולל אנגלית, צרפתית, גרמנית, ספרדית, סינית, יפנית, ערבית ו עוד הרבה. באמצעות OCR SDK, מתכנתי Python יכולים לשלב בקלות פונקציונליות OCR ביישומי Python שלהם מבלי לדאוג למורכבות של טכנולוגיית OCR. ה-SDK מספק ממשק פשוט ואינטואיטיבי המאפשר למשתמשים להעלות תמונות, לבצע OCR ולאחזר טקסט בכמה שורות קוד בלבד. אם אתה צריך להוסיף פונקציונליות OCR ליישומי Python שלך, ה-Aspose.OCR Cloud SDK עבור Python בהחלט שווה בדיקה.
sתחילת העבודה עם Aspose.OCR Cloud SDK עבור Python
הדרך המומלצת להתקנת Aspose.OCR Cloud SDK עבור Python היא באמצעות pip. אנא השתמש בפקודה הבאה להתקנה חלקה.
התקן את Aspose.OCR Cloud SDK עבור Python באמצעות pip
pip install aspose-ocr-cloud
תוכל להוריד את ה-SDK ישירות מדף המוצר Aspose.OCR Python Cloud SDK
זיהוי תמונות באמצעות אפליקציות Python
Aspose.OCR Cloud SDK עבור Python מאפשר למפתחי תוכנה לבצע פעולת OCR כדי להשיג זיהוי תמונה בתוך יישומי Python שלהם. ה-API קל מאוד לשימוש וניתן לבצע זיהוי תמונות מכל פלטפורמה עם גישה לאינטרנט. אתה יכול בקלות להשתמש ב- OCR REST API כדי לבחור ולשלוח תמונות לזיהוי, להביא תוצאות ולאחסן אותן בכל פורמט קובץ נתמך עם כמה שורות קוד בלבד. הדוגמה הבאה מראה כיצד לבצע פעולת OCR בתמונות באמצעות קוד Python.
בצע OCR על תמונה בתוך Python Apps
import asposeocrcloud
# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')
# read the image file
with open('image.jpg', 'rb') as image_file:
image_data = image_file.read()
# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)
# print the extracted text
print(result.text)
חלץ טקסט מקובצי PDF באמצעות Python API
פורמט מסמכים ניידים (PDF) הוא אחד הפורמטים הפופולריים ביותר בעולם של מסמכים עסקיים והוא פורמט קובץ שפותח על ידי Adobe בשנת 1992 כדי להציג מסמכים. Aspose.OCR Cloud SDK עבור Python כללה תכונה חזקה מאוד לחילוץ טקסט מקובצי PDF בתוך יישומי Python. כדי להשיג את המשימה בצורה קלה עליך להעלות את קובץ ה-PDF לאחסון הענן של Aspose ולבצע את זיהוי ה-OCR בקובץ ה-PDF שהועלה. הדוגמה הבאה מראה כיצד מפתחי תוכנה יכולים לחלץ טקסט מקובץ PDF באמצעות קוד Python.
כיצד לחלץ טקסט מקובץ PDF באמצעות Python API?
import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration
configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))
# Upload the PDF file to the Aspose cloud storage
with open('your_pdf_file.pdf', 'rb') as file:
api.upload_file(path='your_pdf_file.pdf', file=file)
# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')
# Story the recognized text
recognized_text = result['text']
print(recognized_text)
המר טקסט לדיבור באמצעות Python API
Aspose.OCR Cloud SDK עבור Python מאפשר למפתחי תוכנה להמיר טקסט מתמונה מבלי להתקין תוכנת צד שלישי. באמצעות ה-API, מתכנתים יכולים להמיר את תוצאות הזיהוי לקול אנושי טבעי שניתן לנגן ברקע או להוריד. צורך ראשון של המשתמש לשלוח את התמונה לשרת Aspose OCR Cloud ולחלץ ממנו טקסט ולאחר מכן להמיר את הטקסט לדיבור באמצעות Aspose OCR Cloud Text-to-Speech API. לאחר ההמרה המוצלחת ניתן לשמור את קובץ הדיבור בדיסק.
כיצד להמיר טקסט לדיבור באמצעות Python API?
import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi
client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))
# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)
# Extract the recognized text
text = ''
for result in response.parts:
for line in result.lines:
for word in line.words:
text += word.text + ' '
# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')
# Save the speech file to disk
with open('output.wav', 'wb') as file:
file.write(response.content)