ספריית OCR חינמית ב‑Swift לביצוע OCR על תמונות סרוקות וקבצי PDF
ספריית קוד פתוח ב‑Swift לזיהוי תווים אופטי (OCR) מאפשרת לסרוק, לזהות ולחלץ טקסט מתמונות מצלמה, תמונות סרוקות וקבצי PDF בחינם ב‑iOS וב‑macOS
מהו SwiftyTesseract?
SwiftyTesseract היא ספרייה מובילה, קוד פתוח, המיועדת במיוחד למערכת Swift, ומאפשרת למפתחי תוכנה לשלב בצורה חלקה זיהוי תווים אופטי מתוחכם באפליקציות iOS ו‑macOS שלהם. על‑ידי ניצול מנוע Tesseract OCR החזק והמאושר בתעשייה, היא מספקת ממשק Swift אינטואיטיבי ומוזרז לחילוץ מדויק של טקסט מתמונות, מסמכים סרוקים ומגוון מדיה דיגיטלית. זה הופך אותה לבסיס אידיאלי למפתחים הבונים הכל, מכלי קריאת טקסט פשוטים ועד לכלי עיבוד נתונים מורכבים הדורשים יכולות סריקה וזיהוי טקסט אמינות בסביבת Apple.
ספרייה זו מפשטת את אינטגרציית OCR על‑ידי עטיפת הפונקציונליות של Tesseract בממשק פשוט וידידותי למפתח. היא מציעה גמישות רחבה כבר מחוץ לקופסה, כולל תמיכה חזקה במגוון שפות – תכונה קריטית ליצירת אפליקציות בינלאומיות. כדי להבטיח דיוק גבוה, SwiftyTesseract משולבת עם יכולות קדם‑עיבוד תמונה חיוניות המשפרות את חדות הטקסט לפני הזיהוי. בנוסף, המפתחים שומרים על שליטה מדויקת על ידי התאמת אפשרויות קונפיגורציה של Tesseract, כגון מצב מנוע OCR ומצב חלוקת דפים. השילוב של קלות שימוש, תמיכה מרובת‑שפות והתאמה עמוקה הופך את SwiftyTesseract לכלי ייחודי, רב‑גוני ועוצמתי למפתחים המתמודדים עם מגוון רחב של פרויקטים לזיהוי טקסט.
התחלת עבודה עם SwiftyTesseract
הדרך המומלצת להתקנת SwiftyTesseract היא באמצעות CocoaPods. אנא השתמשו בפקודה הבאה להתקנה חלקה.
התקנת SwiftyTesseract באמצעות CocoaPods
pod 'SwiftyTesseract' ניתן גם להתקין זאת ידנית; הורידו את קבצי השחרור האחרונים ישירות ממאגר GitHub .
ביצוע OCR על תמונה באמצעות ספריית Swift
ספריית SwiftyTesseract קוד פתוח מקלה על מפתחי תוכנה לטעון סוגים שונים של תמונות ולבצע פעולה של OCR בהתאם לצרכיהם בתוך אפליקציות Swift. ניתן להשתמש בתמונה מה‑assets של האפליקציה או מכל מקור אחר. הספרייה יכולה לזהות טקסט במגוון גופנים, כולל Serif, Arial, Sans‑serif, וגופני כתב. הנה קטע קוד לדוגמה הממחיש כיצד מפתחים יכולים לזהות טקסט מתמונה בתוך אפליקציות Swift.
איך לזהות טקסט מתמונה בתוך אפליקציות Swift?
import SwiftyTesseract
// Load the image
let image = UIImage(named: "image.jpg")!
// Create a Tesseract instance
let tesseract = Tesseract()
// Set the language to English
tesseract.language = "eng"
// Set the image
tesseract.image = image
// Recognize the text
tesseract.recognize() { result in
if let text = result.text {
print("Recognized text: \(text)")
} else {
print("Error recognizing text")
}
}
תמיכה בקדם‑עיבוד תמונות
ספריית SwiftyTesseract מספקת תמיכה מלאה בקדם‑עיבוד תמונות לפני ביצוע פעולות OCR בתוך אפליקציות Swift. לדוגמה, ניתן להמיר תמונות לגווני אפור, לשנות גודל, לכוונן ניגודיות, להסיר הטייה, לבצע בינריזציה ועוד. הנה דוגמה שמראה כיצד מפתחים יכולים לשנות גודל של תמונה לפני ביצוע OCR. בקוד זה, resizeImage משנה את גודל התמונה לפני העיבוד, מה שיכול להיות מועיל בעבודה עם תמונות ברזולוציה גבוהה.
איך לבצע קדם‑עיבוד של תמונות לפני פעולות OCR באפליקציות Swift?
func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
image.draw(in: CGRect(origin: .zero, size: newSize))
let newImage = UIGraphicsGetImageFromCurrentImageContext()
UIGraphicsEndImageContext()
return newImage
}
if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
tesseract.performOCR(on: resizedImage) { recognizedText in
print("Resized Image OCR result: \(recognizedText ?? "No text found")")
}
}
פעולות OCR מרובות שפות באמצעות ספריית Swift
ספריית SwiftyTesseract קוד פתוח תומכת בזיהוי טקסט ביותר מ‑100 שפות, כולל אנגלית, ספרדית, צרפתית, גרמנית, סינית ועוד רבות. ניתן להגדיר את השפה הרצויה בעת אתחול הספרייה. תכונה זו מרחיבה את תחום השימוש למשתמשים בינלאומיים ולדרישות עיבוד מרובות‑שפות. בנוסף, מפתחים יכולים ליצור מילונים מותאמים לשיפור דיוק תהליך ה‑OCR. הנה דוגמה להגדרת הספרייה לאנגלית וספרדית. קוד זה מאפשר OCR הן באנגלית והן בספרדית, מה שמועיל בעיבוד מסמכים עם תוכן רב‑שפתי.
איך לבחור שפות לפעולות OCR מרובות שפות באפליקציות Swift?
let tesseract = SwiftyTesseract(language: [.english, .spanish])
פרמטרים ניתנים להתאמה אישית של OCR
באמצעות ספריית SwiftyTesseract קוד פתוח, למפתחי תוכנה יש אפשרות להתאים את הגדרות ה‑OCR לשיפור הדיוק עבור סוגי מסמכים או שפות ספציפיים. היא מאפשרת למפתחים לכוונן במדויק את תהליך ה‑OCR, מה שהופך את הספרייה להתאימה לתרחישים ייחודיים או מורכבים. זה כולל אפשרות לציין שפות ומשתני OCR בהתאם לצורכי המסמך. להלן דוגמה שמראה כיצד מפתחים יכולים להתאים את מצב מנוע OCR ואת מצב חלוקת העמודים.
איך להתאים את מצב מנוע OCR ואת מצב חלוקת העמודים באמצעות API של Swift?
let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
if let recognizedString = recognizedString {
print("Recognized text with custom PSM: \(recognizedString)")
}
}