1. 제품
  2.   OCR
  3.   Python
  4.   Aspose.OCR Cloud SDK for Python

Aspose.OCR Cloud SDK for Python

 
 

이미지 텍스트를 읽고 추출하는 최고의 Python OCR API

OCR API를 통해 Python 앱에 OCR 기능을 추가합니다. Python OCR 라이브러리를 통해 이미지, 사진, 스크린샷, 스캔한 문서 및 PDF 파일에서 텍스트를 읽고 추출할 수 있습니다.

Aspose.OCR Python용 Cloud SDK는 소프트웨어 개발자가 외부 종속성 없이 OCR 애플리케이션을 만들 수 있도록 도와주는 유연한 고급 OCR(광학 문자 인식) 솔루션입니다. 이를 통해 소프트웨어 개발자는 이미지, 사진, 스크린샷, 스캔한 문서 및 다수의 유럽, 키릴 문자 및 동부 문자로 된 PDF에서 텍스트를 읽고 추출하여 가장 널리 사용되는 문서 형식으로 결과를 반환할 수 있습니다. API를 사용하면 개발자가 넷북, 미니 PC, 심지어 보급형 스마트폰을 포함한 거의 모든 기기나 플랫폼에 OCR 기능을 쉽게 추가할 수 있습니다.

Python용 Aspose.OCR Cloud SDK는 간단하고 다루기 쉽습니다. 전체 이미지 읽기, 스캔한 PDF 문서 읽기, 이미지의 특정 영역에서 텍스트 추출, 스캔 또는 사진에서 데이터 추출 등 Python으로 작업하는 개발자에게 이상적인 OCR 솔루션을 제공하는 다양한 기능을 제공합니다. 영수증, PDF 인식 결과 가져오기, 스캔하거나 사진을 찍은 테이블에서 텍스트 추출, 인식 결과를 자연스러운 사람 음성으로 변환 등이 있습니다.

Aspose.OCR Cloud SDK for Python은 Aspose.OCR Cloud API를 기반으로 구축되었으며 영어, 프랑스어, 독일어, 스페인어, 중국어, 일본어, 아랍어 및 기타 언어를 포함한 45개 인식 언어를 지원하는 클라우드 기반 OCR 엔진입니다. 더 많은 것. OCR SDK를 사용하면 Python 프로그래머는 OCR 기술의 복잡성에 대해 걱정할 필요 없이 OCR 기능을 Python 애플리케이션에 쉽게 통합할 수 있습니다. SDK는 사용자가 단 몇 줄의 코드만으로 이미지를 업로드하고, OCR을 수행하고, 텍스트를 검색할 수 있는 간단하고 직관적인 인터페이스를 제공합니다. Python 애플리케이션에 OCR 기능을 추가해야 한다면 Python용 Aspose.OCR Cloud SDK를 확인해 볼 가치가 있습니다.

Previous Next

Python용 Aspose.OCR Cloud SDK 시작하기

Python용 Aspose.OCR Cloud SDK를 설치하는 데 권장되는 방법은 pip를 사용하는 것입니다. 원활한 설치를 위해 다음 명령어를 사용하시기 바랍니다.

pip를 통해 Python용 Aspose.OCR Cloud SDK 설치

 pip install aspose-ocr-cloud

Aspose.OCR Python Cloud SDK 제품 페이지에서 SDK를 직접 다운로드할 수 있습니다.

Python 앱을 사용한 이미지 인식

Python용 Aspose.OCR Cloud SDK를 사용하면 소프트웨어 개발자가 OCR 작업을 수행하여 자체 Python 애플리케이션 내에서 이미지 인식을 달성할 수 있습니다. API는 사용이 매우 쉽고 인터넷 접속이 가능한 모든 플랫폼에서 이미지 인식을 수행할 수 있습니다. OCR REST API를 사용하여 쉽게 인식할 이미지를 선택 및 전송하고, 결과를 가져오고, 단 몇 줄의 코드만으로 지원되는 모든 파일 형식으로 저장할 수 있습니다. 다음 예에서는 Python 코드를 사용하여 이미지에 대해 OCR 작업을 수행하는 방법을 보여줍니다.

Python 앱 내부 이미지에 OCR 수행

import asposeocrcloud

# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')

# read the image file
with open('image.jpg', 'rb') as image_file:
    image_data = image_file.read()

# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)

# print the extracted text
print(result.text)

Python API를 통해 PDF 파일에서 텍스트 추출

PDF(Portable Document Format)는 세계에서 가장 널리 사용되는 비즈니스 문서 파일 형식 중 하나로 1992년 Adobe가 문서를 표현하기 위해 개발한 파일 형식입니다. Python용 Aspose.OCR Cloud SDK에는 Python 애플리케이션 내부의 PDF 파일에서 텍스트를 추출하는 매우 강력한 기능이 포함되어 있습니다. 작업을 쉽게 수행하려면 PDF 파일을 Aspose 클라우드 스토리지에 업로드하고 업로드된 PDF 파일에 대해 OCR 인식을 수행해야 합니다. 다음 예에서는 소프트웨어 개발자가 Python 코드를 사용하여 PDF 파일에서 텍스트를 추출하는 방법을 보여줍니다.

Python API를 통해 PDF 파일에서 텍스트를 추출하는 방법

import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration

configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))

# Upload the PDF file to the Aspose cloud storage

with open('your_pdf_file.pdf', 'rb') as file:
    api.upload_file(path='your_pdf_file.pdf', file=file)

# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')

# Story the recognized text

recognized_text = result['text']
print(recognized_text)

Python API를 통해 텍스트를 음성으로 변환

Python용 Aspose.OCR Cloud SDK를 사용하면 소프트웨어 개발자가 타사 소프트웨어를 설치하지 않고도 이미지에서 텍스트를 변환할 수 있습니다. API를 사용하여 프로그래머는 인식 결과를 백그라운드에서 재생하거나 다운로드할 수 있는 자연스러운 사람 음성으로 변환할 수 있습니다. 첫 번째 사용자는 이미지를 Aspose OCR Cloud 서버로 보내고 여기에서 텍스트를 추출한 후 Aspose OCR Cloud Text-to-Speech API를 사용하여 텍스트를 음성으로 변환해야 합니다. 변환이 성공적으로 완료되면 음성 파일을 디스크에 저장할 수 있습니다.

Python API를 사용하여 텍스트를 음성으로 변환하는 방법

 import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi

client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))

# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
    response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)

# Extract the recognized text

text = ''
for result in response.parts:
    for line in result.lines:
        for word in line.words:
            text += word.text + ' '

# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')

# Save the speech file to disk

with open('output.wav', 'wb') as file:
    file.write(response.content)

 한국인