Perpustakaan OCR Swift Gratis untuk Melakukan OCR pada Gambar & PDF yang Dipindai

Perpustakaan OCR (Optical Character Recognition) Swift Open Source memungkinkan untuk Memindai, Mengenali, dan Mengekstrak Teks dari Foto Kamera, Gambar yang Dipindai & PDF secara gratis di iOS dan macOS

Apa itu SwiftyTesseract?

SwiftyTesseract adalah perpustakaan OCR sumber terbuka terkemuka yang dirancang khusus untuk ekosistem Swift, memberdayakan pengembang perangkat lunak untuk mengintegrasikan pengenalan karakter optik yang canggih secara mulus ke dalam aplikasi iOS dan macOS mereka. Dengan memanfaatkan mesin Tesseract OCR yang kuat dan terbukti di industri, perpustakaan ini menyediakan antarmuka Swift yang intuitif dan terstruktur untuk mengekstrak teks secara akurat dari gambar, dokumen yang dipindai, dan berbagai media digital. Hal ini menjadikannya fondasi ideal bagi pengembang yang membangun segala hal mulai dari utilitas pembaca teks sederhana hingga alat pemrosesan data kompleks yang memerlukan kemampuan pemindaian dan pengenalan teks yang dapat diandalkan dalam lingkungan Apple.

Perpustakaan ini menyederhanakan integrasi OCR dengan membungkus fungsionalitas Tesseract ke dalam API yang langsung dan ramah pengembang. Ia menawarkan fleksibilitas luas langsung dari kotak, termasuk dukungan kuat untuk banyak bahasa—fitur penting untuk menciptakan aplikasi internasional. Untuk memastikan akurasi tinggi, SwiftyTesseract menyertakan kemampuan praproses gambar penting yang meningkatkan kejernihan teks sebelum pengenalan. Lebih jauh, pengembang tetap memiliki kontrol detail dengan menyesuaikan opsi konfigurasi Tesseract utama, seperti mode mesin OCR dan mode segmentasi halaman. Kombinasi kemudahan penggunaan, dukungan multi‑bahasa, dan kustomisasi mendalam menjadikan SwiftyTesseract alat yang sangat serbaguna dan kuat bagi pengembang perangkat lunak yang menangani spektrum luas proyek pengenalan teks.

Sekilas

Gambaran umum fitur SwiftyTesseract.

Features Overview

Lakukan Operasi OCR
Tambahkan Kemampuan OCR
Kenali Teks Gambar
Ekspor Gambar ke Teks
Kenali Teks Font
Cari PDF
Lebih dari 100 Bahasa
Buat aplikasi OCR
Simpan ke peramban
Ekstrak Teks
Dukungan Multi-threading
Kenali teks gambar

SwiftyTesseract

SwiftyTesseract mendukung format file gambar populer yang tercantum di bawah.

Pembaca

PNG, JPEG, BMP, TIFF, TGA, DICOM

Penulis

PNG, JPEG, BMP, TIFF

SwiftyTesseract

Kemandirian Platform

SwiftyTesseract dapat bekerja dengan bahasa pemrograman berbasis Swift apa pun

Swift 4.1 ke atas.

SwiftyTesseract

Memulai dengan SwiftyTesseract

Cara yang disarankan untuk menginstal SwiftyTesseract adalah menggunakan CocoaPods. Silakan gunakan perintah berikut untuk instalasi yang lancar.

Instal SwiftyTesseract via CocoaPods

 pod 'SwiftyTesseract'

Anda juga dapat menginstalnya secara manual; unduh file rilis terbaru langsung dari GitHub repositori.

Lakukan OCR pada Gambar melalui Perpustakaan Swift

Perpustakaan SwiftyTesseract sumber terbuka memudahkan pengembang perangkat lunak untuk memuat berbagai jenis gambar dan melakukan operasi OCR sesuai kebutuhan di dalam aplikasi Swift. Anda dapat menggunakan gambar dari aset aplikasi Anda atau sumber lain apa pun. Perpustakaan ini dapat mengenali teks dalam berbagai jenis huruf, termasuk Serif, Arial, Sans-serif, dan huruf skrip. Berikut contoh potongan kode yang menunjukkan cara pengembang perangkat lunak dapat mengenali teks dari gambar di dalam aplikasi Swift.

Bagaimana Cara Mengenali Teks dari Gambar di dalam Aplikasi Swift?

import SwiftyTesseract

// Load the image
let image = UIImage(named: "image.jpg")!

// Create a Tesseract instance
let tesseract = Tesseract()

// Set the language to English
tesseract.language = "eng"

// Set the image
tesseract.image = image

// Recognize the text
tesseract.recognize() { result in
    if let text = result.text {
        print("Recognized text: \(text)")
    } else {
        print("Error recognizing text")
    }
}

Dukungan Praproses Gambar

Perpustakaan SwiftyTesseract telah menyediakan dukungan lengkap untuk praproses gambar sebelum melakukan operasi OCR di dalam aplikasi Swift. Misalnya, Anda dapat mengonversi gambar ke skala abu‑abu, mengubah ukuran, atau menyesuaikan kontras, meluruskan gambar, melakukan binarisasi, dan sebagainya. Berikut contoh yang menunjukkan bagaimana pengembang dapat mengubah ukuran gambar sebelum melakukan OCR. Dalam contoh kode ini, resizeImage mengubah ukuran gambar sebelum diproses, yang dapat membantu ketika bekerja dengan gambar resolusi tinggi.

Bagaimana Cara Praproses Gambar sebelum Operasi OCR di dalam Aplikasi Swift?

func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
    UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
    image.draw(in: CGRect(origin: .zero, size: newSize))
    let newImage = UIGraphicsGetImageFromCurrentImageContext()
    UIGraphicsEndImageContext()
    return newImage
}

if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
    tesseract.performOCR(on: resizedImage) { recognizedText in
        print("Resized Image OCR result: \(recognizedText ?? "No text found")")
    }
}

Operasi OCR Multi-bahasa melalui Perpustakaan Swift

Perpustakaan SwiftyTesseract sumber terbuka mendukung pengenalan teks dalam lebih dari 100 bahasa, termasuk Bahasa Inggris, Spanyol, Prancis, Jerman, Mandarin, dan banyak lagi. Anda dapat menentukan bahasa pilihan saat menginisialisasi perpustakaan. Fitur ini memperluas cakupan aplikasi bagi pengguna internasional dan kebutuhan pemrosesan multi‑bahasa. Selain itu, pengembang dapat membuat kamus khusus untuk meningkatkan akurasi proses OCR. Berikut contoh konfigurasi perpustakaan untuk Bahasa Inggris dan Spanyol. Kode ini mengaktifkan OCR dalam kedua bahasa tersebut, yang berguna saat memproses dokumen dengan konten bahasa campuran.

Bagaimana Cara Memilih Bahasa untuk Operasi OCR Multi‑bahasa di dalam Aplikasi Swift?

let tesseract = SwiftyTesseract(language: [.english, .spanish])

Parameter OCR yang Dapat Disesuaikan

Dengan menggunakan perpustakaan SwiftyTesseract sumber terbuka, pengembang perangkat lunak memiliki kemampuan untuk menyesuaikan pengaturan OCR guna meningkatkan akurasi untuk tipe dokumen atau bahasa tertentu. Hal ini memungkinkan pengembang menyempurnakan proses OCR, menjadikan perpustakaan dapat beradaptasi untuk skenario OCR yang unik atau kompleks. Ini mencakup kemampuan untuk menentukan bahasa dan variabel OCR berdasarkan kebutuhan dokumen. Di bawah ini contoh yang menunjukkan bagaimana pengembang dapat menyesuaikan mode mesin OCR dan mode segmentasi halaman.

Bagaimana Cara Menyesuaikan Mode Mesin OCR dan Mode Segmentasi Halaman via Swift API?

let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
    if let recognizedString = recognizedString {
        print("Recognized text with custom PSM: \(recognizedString)")
    }
}