1. 제품
  2.   OCR
  3.   Swift
  4.   SwiftyTesseract
 
  

스캔된 이미지 및 PDF에서 OCR을 수행하는 무료 Swift OCR 라이브러리

오픈 소스 Swift 광학 문자 인식(OCR) 라이브러리는 iOS 및 macOS 내에서 카메라 사진, 스캔된 이미지 및 PDF에서 텍스트를 무료로 스캔, 인식 및 추출할 수 있게 합니다.

SwiftyTesseract란?

SwiftyTesseract는 Swift 생태계에 특화된 최고의 오픈 소스 OCR 라이브러리로, iOS 및 macOS 애플리케이션에 정교한 광학 문자 인식을 손쉽게 통합할 수 있도록 개발자를 지원합니다. 강력하고 업계 검증된 Tesseract OCR 엔진을 활용하여 이미지, 스캔된 문서 및 다양한 디지털 미디어에서 텍스트를 정확히 추출하기 위한 직관적이고 간소화된 Swift 인터페이스를 제공합니다. 이는 Apple 환경 내에서 신뢰할 수 있는 텍스트 스캔 및 인식 기능이 필요한 간단한 텍스트 읽기 유틸리티부터 복잡한 데이터 처리 도구에 이르기까지 모든 종류의 개발자를 위한 이상적인 기반이 됩니다.

이 라이브러리는 Tesseract의 기능을 직관적이고 개발자 친화적인 API로 래핑하여 OCR 통합을 간소화합니다. 다국어 지원을 포함한 폭넓은 다재다능성을 기본 제공하여 국제화 애플리케이션을 만드는 데 필수적인 요소입니다. 높은 정확성을 보장하기 위해 SwiftyTesseract는 인식 전 텍스트 선명도를 향상시키는 필수 이미지 전처리 기능을 포함합니다. 또한 개발자는 OCR 엔진 모드와 페이지 분할 모드와 같은 핵심 Tesseract 구성 옵션을 맞춤 설정하여 세밀한 제어를 유지할 수 있습니다. 사용 편의성, 다국어 지원 및 깊은 커스터마이징이 결합된 SwiftyTesseract는 다양한 텍스트 인식 프로젝트를 수행하는 소프트웨어 개발자에게 독특하고 강력한 도구입니다.

Previous Next

SwiftyTesseract 시작하기

SwiftyTesseract를 설치하는 권장 방법은 CocoaPods를 사용하는 것입니다. 원활한 설치를 위해 다음 명령을 사용하십시오.

CocoaPods를 통한 SwiftyTesseract 설치

 pod 'SwiftyTesseract' 

수동으로 설치할 수도 있습니다; 최신 릴리스 파일을 GitHub 저장소에서 직접 다운로드하십시오.

Swift 라이브러리를 통한 이미지 OCR 수행

오픈 소스 SwiftyTesseract 라이브러리는 소프트웨어 개발자가 다양한 유형의 이미지를 로드하고 Swift 애플리케이션 내에서 필요에 따라 OCR 작업을 수행하도록 쉽게 만들어 줍니다. 앱의 에셋이나 다른 소스에서 이미지를 사용할 수 있습니다. 이 라이브러리는 Serif, Arial, Sans-serif, 스크립트 폰트 등 다양한 폰트의 텍스트를 인식할 수 있습니다. 아래는 Swift 애플리케이션 내에서 이미지의 텍스트를 인식하는 방법을 보여주는 샘플 코드 스니펫입니다.

Swift 애플리케이션 내에서 이미지에서 텍스트를 인식하는 방법?

import SwiftyTesseract

// Load the image
let image = UIImage(named: "image.jpg")!

// Create a Tesseract instance
let tesseract = Tesseract()

// Set the language to English
tesseract.language = "eng"

// Set the image
tesseract.image = image

// Recognize the text
tesseract.recognize() { result in
    if let text = result.text {
        print("Recognized text: \(text)")
    } else {
        print("Error recognizing text")
    }
}

이미지 전처리 지원

SwiftyTesseract 라이브러리는 Swift 애플리케이션 내에서 OCR 작업을 수행하기 전에 이미지를 전처리하는 완전한 지원을 제공합니다. 예를 들어 이미지를 그레이스케일로 변환하거나, 크기를 조정하거나, 대비를 조정하고, 이미지 기울기를 보정하거나, 이진화 등을 할 수 있습니다. 아래 예시는 개발자가 OCR을 수행하기 전에 이미지를 리사이즈하는 방법을 보여줍니다. 이 코드 예제에서 resizeImage는 이미지를 처리하기 전에 크기를 조정하며, 고해상도 이미지를 다룰 때 유용합니다.

Swift 앱에서 OCR 작업 전에 이미지를 전처리하는 방법?

func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
    UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
    image.draw(in: CGRect(origin: .zero, size: newSize))
    let newImage = UIGraphicsGetImageFromCurrentImageContext()
    UIGraphicsEndImageContext()
    return newImage
}

if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
    tesseract.performOCR(on: resizedImage) { recognizedText in
        print("Resized Image OCR result: \(recognizedText ?? "No text found")")
    }
}

Swift 라이브러리를 통한 다국어 OCR 작업

오픈 소스 SwiftyTesseract 라이브러리는 영어, 스페인어, 프랑스어, 독일어, 중국어 등 100개 이상의 언어에서 텍스트 인식을 지원합니다. 라이브러리를 초기화할 때 원하는 언어를 설정할 수 있습니다. 이 기능은 국제 사용자와 다국어 처리 요구 사항을 위한 적용 범위를 넓혀줍니다. 또한 개발자는 OCR 프로세스 정확성을 향상시키기 위해 사용자 정의 사전을 만들 수 있습니다. 아래 예시는 영어와 스페인어를 모두 지원하도록 라이브러리를 구성하는 방법을 보여줍니다. 이 코드는 혼합 언어 문서를 처리할 때 유용합니다.

Swift 앱에서 다국어 OCR 작업을 위한 언어 선택 방법?

let tesseract = SwiftyTesseract(language: [.english, .spanish])

맞춤형 OCR 매개변수

오픈 소스 SwiftyTesseract 라이브러리를 사용하면 소프트웨어 개발자가 특정 문서 유형이나 언어에 대한 정확성을 높이기 위해 OCR 설정을 맞춤화할 수 있습니다. 이는 개발자가 OCR 처리를 세밀하게 조정하여 고유하거나 복잡한 OCR 시나리오에 라이브러리를 적용할 수 있게 합니다. 여기에는 문서 요구에 따라 언어와 OCR 변수를 지정하는 기능이 포함됩니다. 아래 예시는 개발자가 OCR 엔진 모드와 페이지 분할 모드를 맞춤 설정하는 방법을 보여줍니다.

Swift API를 통해 OCR 엔진 모드 및 페이지 분할 모드를 맞춤 설정하는 방법?

let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
    if let recognizedString = recognizedString {
        print("Recognized text with custom PSM: \(recognizedString)")
    }
}
 한국인