Aspose.OCR Cloud SDK for Python
Görüntü Metinlerini Okumak ve Çıkarmak için En İyi Python OCR API'si
OCR API aracılığıyla Python Uygulamalarına OCR İşlevselliği ekleyin. Python OCR Kitaplığı aracılığıyla Resimlerden, Fotoğraflardan, Ekran Görüntülerinden, Taranan belgelerden ve PDF Dosyalarından metin Okumanıza ve Çıkarmanıza İzin Verir.
Aspose.OCR Cloud SDK for Python, yazılım geliştiricilerin herhangi bir dış bağımlılık olmadan OCR uygulamaları oluşturmasına yardımcı olan gelişmiş ve esnek bir optik karakter tanıma (OCR) çözümüdür. Yazılım geliştiricilerin çok sayıda Avrupa, Kiril ve Doğu alfabesindeki resimlerden, fotoğraflardan, ekran görüntülerinden, taranmış belgelerden ve PDF'lerden metin okumasına ve ayıklamasına olanak tanır ve sonuçları en popüler belge formatlarında döndürür. API, geliştiricilerin netbook'lar, mini bilgisayarlar ve hatta giriş seviyesi akıllı telefonlar da dahil olmak üzere hemen hemen her cihaza veya platforma OCR işlevselliği eklemesini kolaylaştırır.
Python için Aspose.OCR Cloud SDK basit ve kullanımı kolaydır. Bir görüntünün tamamını okumak, taranmış bir PDF belgesini okumak, görüntünün belirli bir bölgesinden metin çıkarmak, taranmış veya fotoğrafı çekilmiş bir belgeden veri çıkarmak gibi Python ile çalışan geliştiriciler için onu ideal bir OCR çözümü haline getiren çok çeşitli özellikler sunar. makbuz, PDF tanıma sonuçlarını getirme, taranan veya fotoğrafı çekilen tablolardan metin çıkarma, tanıma sonuçlarını doğal insan sesine dönüştürme ve çok daha fazlası.
Python için Aspose.OCR Cloud SDK, Aspose.OCR Cloud API'nin üzerine inşa edilmiştir; İngilizce, Fransızca, Almanca, İspanyolca, Çince, Japonca, Arapça ve dahil olmak üzere 45 tanıma dilini destekleyen bulut tabanlı bir OCR motorudur. çok daha fazlası. Python programcıları, OCR SDK'yı kullanarak OCR teknolojisinin karmaşıklığı konusunda endişelenmelerine gerek kalmadan OCR işlevselliğini Python uygulamalarına kolayca entegre edebilirler. SDK, kullanıcıların yalnızca birkaç satır kodla resim yüklemesine, OCR gerçekleştirmesine ve metin almasına olanak tanıyan basit ve sezgisel bir arayüz sağlar. Python uygulamalarınıza OCR işlevselliği eklemeniz gerekiyorsa Aspose.OCR Cloud SDK for Python kesinlikle göz atmaya değer.
Python için Aspose.OCR Cloud SDK'yı Kullanmaya Başlarken
Python için Aspose.OCR Cloud SDK'yı kurmanın önerilen yolu pip kullanmaktır. Sorunsuz bir kurulum için lütfen aşağıdaki komutu kullanın.
Pip aracılığıyla Aspose.OCR Cloud SDK for Python'u yükleyin
pip install aspose-ocr-cloud
SDK'yı doğrudan Aspose.OCR Python Cloud SDK ürün sayfasından
indirebilirsiniz.Python Uygulamalarını Kullanarak Görüntü Tanıma
Aspose.OCR Cloud SDK for Python, yazılım geliştiricilerin kendi Python uygulamaları içinde görüntü tanımayı sağlamak için OCR işlemi gerçekleştirmesine olanak tanır. API'nin kullanımı oldukça kolaydır ve görüntü tanıma, İnternet erişimi olan herhangi bir platformdan gerçekleştirilebilir. Yalnızca birkaç satır kodla görüntüleri seçip göndermek, sonuçları almak ve desteklenen herhangi bir dosya biçiminde saklamak için OCR REST API'yi kolayca kullanabilirsiniz. Aşağıdaki örnek, Python kodunu kullanarak görüntüler üzerinde OCR işleminin nasıl gerçekleştirileceğini gösterir.
Python Uygulamaları içindeki bir görüntü üzerinde OCR gerçekleştirme
import asposeocrcloud
# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')
# read the image file
with open('image.jpg', 'rb') as image_file:
image_data = image_file.read()
# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)
# print the extracted text
print(result.text)
Python API aracılığıyla PDF Dosyalarından Metin Çıkarma
Taşınabilir Belge Formatı (PDF), dünyanın en popüler iş belgesi dosya formatlarından biridir ve Adobe tarafından 1992 yılında belgeleri sunmak için geliştirilen bir dosya formatıdır. Aspose.OCR Cloud SDK for Python, Python uygulamalarının içindeki PDF dosyalarından metin çıkarmak için çok güçlü bir özellik içeriyor. Görevi kolay bir şekilde gerçekleştirmek için PDF dosyasını Aspose bulut depolama alanına yüklemeniz ve yüklenen PDF dosyasında OCR tanıma işlemini gerçekleştirmeniz gerekir. Aşağıdaki örnek, yazılım geliştiricilerin Python kodunu kullanarak bir PDF dosyasından nasıl metin çıkarabileceklerini göstermektedir.
Python API aracılığıyla PDF Dosyasından Metin Nasıl Çıkarılır?
import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration
configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))
# Upload the PDF file to the Aspose cloud storage
with open('your_pdf_file.pdf', 'rb') as file:
api.upload_file(path='your_pdf_file.pdf', file=file)
# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')
# Story the recognized text
recognized_text = result['text']
print(recognized_text)
Python API aracılığıyla Metni Konuşmaya Dönüştürme
Aspose.OCR Cloud SDK for Python, yazılım geliştiricilerin herhangi bir 3. taraf yazılımı yüklemeden görüntüdeki metni dönüştürmesine olanak tanır. Programcılar, API'yi kullanarak, tanıma sonuçlarını arka planda çalınabilecek veya indirilebilecek doğal bir insan sesine dönüştürebilir. İlk kullanıcının görüntüyü Aspose OCR Cloud sunucusuna göndermesi ve oradan metin çıkarması ve ardından Aspose OCR Cloud Text-to-Speech API'sini kullanarak metni konuşmaya dönüştürmesi gerekir. Başarılı dönüşümden sonra konuşma dosyasını diske kaydedebilirsiniz.
Python API'sini kullanarak Metni Konuşmaya Nasıl Dönüştürürüz?
import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi
client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))
# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)
# Extract the recognized text
text = ''
for result in response.parts:
for line in result.lines:
for word in line.words:
text += word.text + ' '
# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')
# Save the speech file to disk
with open('output.wav', 'wb') as file:
file.write(response.content)