Free Swift OCR Library to Perform OCR on Scanned Images & PDFs

Open Source Swift Optical Character Recognition (OCR) Library allows to Scan, Recognize, and Extract Text from Camera Photos Scanned Images & PDFs for free inside iOS and macOS

SwiftyTesseract Nedir?

SwiftyTesseract, Swift ekosistemi için özel olarak tasarlanmış birinci sınıf, açık kaynaklı bir OCR kütüphanesidir ve yazılım geliştiricilerin iOS ve macOS uygulamalarına gelişmiş optik karakter tanıma yeteneklerini sorunsuz bir şekilde entegre etmelerini sağlar. Güçlü ve sektörde kanıtlanmış Tesseract OCR motorunu kullanarak, görüntülerden, taranmış belgelerden ve çeşitli dijital medyalardan metni doğru bir şekilde çıkarmak için sezgisel ve akıcı bir Swift arayüzü sunar. Bu, Apple ortamında güvenilir metin tarama ve tanıma yeteneklerine ihtiyaç duyan basit metin okuma yardımcılarından karmaşık veri işleme araçlarına kadar her türlü uygulama geliştirenler için ideal bir temel oluşturur.

Bu kütüphane, Tesseract'ın işlevselliğini doğrudan ve geliştirici dostu bir API içinde paketleyerek OCR entegrasyonunu basitleştirir. Kutudan çıktığı anda geniş bir çok yönlülük sunar; çoklu dil desteği gibi uluslararası uygulamalar oluşturmak için kritik bir özellik sağlar. Yüksek doğruluk sağlamak amacıyla SwiftyTesseract, tanıma öncesinde metin netliğini artıran temel görüntü ön işleme yeteneklerini içerir. Ayrıca geliştiriciler, OCR motor modu ve sayfa segmentasyon modu gibi temel Tesseract yapılandırma seçeneklerini özelleştirerek ince ayar yapabilirler. Kullanım kolaylığı, çoklu dil desteği ve derin özelleştirilebilirliği bir araya getiren SwiftyTesseract, metin tanıma projelerinin geniş bir yelpazesini ele alan yazılım geliştiricileri için benzersiz bir şekilde çok yönlü ve güçlü bir araçtır.

Genel Bakış

SwiftyTesseract özelliklerine genel bakış.

Özellikler Özeti

OCR İşlemleri Yap
OCR Yeteneği Ekle
Görüntü Metnini Tanı
Görüntüden Metne Dışa Aktarım
Yazı Tipi Metnini Tanı
PDF Ara
100'den Fazla Dil
OCR Uygulamaları Oluştur
Tarayıcıya Kaydet
Metin Çıkar
Çoklu İş Parçacığı Desteği
Görüntü Metinlerini Tanı

SwiftyTesseract

SwiftyTesseract aşağıda listelenen popüler görüntü dosya formatlarını destekler.

Okuyucu

PNG, JPEG, BMP, TIFF, TGA, DICOM

Yazıcı

PNG, JPEG, BMP, TIFF

SwiftyTesseract

Platform Bağımsızlığı

SwiftyTesseract, Swift tabanlı herhangi bir programlama diliyle çalışabilir

Swift 4.1 ve üzeri.

SwiftyTesseract

SwiftyTesseract ile Başlarken

SwiftyTesseract'i kurmanın önerilen yolu CocoaPods kullanmaktır. Sorunsuz bir kurulum için lütfen aşağıdaki komutu kullanın.

Install SwiftyTesseractvia CocoaPods

 pod 'SwiftyTesseract'

Ayrıca manuel olarak da kurabilirsiniz; en son sürüm dosyalarını doğrudan GitHub deposundan indirebilirsiniz.

Swift Kütüphanesi ile Görüntü Üzerinde OCR Gerçekleştirme

Açık kaynaklı SwiftyTesseract kütüphanesi, yazılım geliştiricilerin çeşitli görüntü tiplerini yüklemelerini ve ihtiyaçlarına göre OCR işlemi gerçekleştirmelerini Swift uygulamaları içinde kolaylaştırır. Uygulamanızın varlıklarından ya da başka bir kaynaktan bir görüntü kullanabilirsiniz. Kütüphane, Serif, Arial, Sans-serif ve el yazısı gibi çeşitli yazı tiplerindeki metni tanıyabilir. Aşağıda, Swift uygulamaları içinde bir görüntüden metin tanımanın nasıl yapılacağını gösteren örnek kod parçacığı yer almaktadır.

How to Recognize Text from an Image inside Swift Applications?

import SwiftyTesseract

// Load the image
let image = UIImage(named: "image.jpg")!

// Create a Tesseract instance
let tesseract = Tesseract()

// Set the language to English
tesseract.language = "eng"

// Set the image
tesseract.image = image

// Recognize the text
tesseract.recognize() { result in
    if let text = result.text {
        print("Recognized text: \(text)")
    } else {
        print("Error recognizing text")
    }
}

Görüntü Ön İşleme Desteği

SwiftyTesseract kütüphanesi, Swift uygulamaları içinde OCR işlemleri gerçekleştirmeden önce görüntüleri ön işleme konusunda tam destek sağlar. Örneğin, görüntüleri gri tonlamaya dönüştürebilir, yeniden boyutlandırabilir, kontrastı ayarlayabilir, eğriliği düzeltebilir, ikilileştirme yapabilirsiniz. Aşağıda, geliştiricilerin OCR gerçekleştirmeden önce bir görüntüyü yeniden boyutlandırmasını gösteren bir örnek yer almaktadır. Bu kod örneğinde, resizeImage fonksiyonu görüntüyü işlenmeden önce yeniden boyutlandırır; bu, yüksek çözünürlüklü görüntülerle çalışırken faydalı olabilir.

How to Preprocessing Images before OCR Operations inside Swift Apps?

func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
    UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
    image.draw(in: CGRect(origin: .zero, size: newSize))
    let newImage = UIGraphicsGetImageFromCurrentImageContext()
    UIGraphicsEndImageContext()
    return newImage
}

if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
    tesseract.performOCR(on: resizedImage) { recognizedText in
        print("Resized Image OCR result: \(recognizedText ?? "No text found")")
    }
}

Swift Kütüphanesi ile Çok Dilli OCR İşlemleri

Açık kaynaklı SwiftyTesseract kütüphanesi, İngilizce, İspanyolca, Fransızca, Almanca, Çince ve daha fazlası dahil olmak üzere 100'den fazla dilde metin tanımayı destekler. Kütüphaneyi başlatırken tercih ettiğiniz dili ayarlayabilirsiniz. Bu özellik, uluslararası kullanıcılar ve çok dilli işleme gereksinimleri için uygulama kapsamını genişletir. Ayrıca geliştiriciler, OCR sürecinin doğruluğunu artırmak için özel sözlükler oluşturabilirler. Aşağıda, kütüphaneyi İngilizce ve İspanyolca için yapılandırma örneği yer almaktadır. Bu kod, karışık dil içeren belgeleri işlerken hem İngilizce hem de İspanyolca OCR yapmanıza olanak tanır.

How to Select Languages for Multi-language OCR Operations inside Swift Apps?

let tesseract = SwiftyTesseract(language: [.english, .spanish])

Özelleştirilebilir OCR Parametreleri

Açık kaynaklı SwiftyTesseract kütüphanesini kullanarak, yazılım geliştiriciler belirli belge türleri veya diller için doğruluğu artırmak amacıyla OCR ayarlarını özelleştirme yeteneğine sahiptir. Bu, OCR işleme sürecini ince ayar yaparak, kütüphaneyi benzersiz veya karmaşık OCR senaryolarına uyumlu hale getirir. Bu, belge ihtiyaçlarına göre dilleri ve OCR değişkenlerini belirleme yeteneğini içerir. Aşağıda, geliştiricilerin OCR motor modunu ve sayfa segmentasyon modunu nasıl özelleştirebileceklerini gösteren bir örnek yer almaktadır.

How to Customize OCR Engine Mode and Page Segmentation Mode via Swift API?

let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
    if let recognizedString = recognizedString {
        print("Recognized text with custom PSM: \(recognizedString)")
    }
}