स्कैन की गई छवियों और PDFs पर OCR करने के लिए मुफ्त Swift OCR लाइब्रेरी
ओपन सोर्स Swift ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) लाइब्रेरी iOS और macOS में कैमरा फोटो, स्कैन की गई छवियों और PDFs से मुफ्त में स्कैन, पहचान और टेक्स्ट निकालने की अनुमति देती है
SwiftyTesseract क्या है?
SwiftyTesseract एक प्रमुख, ओपन-सोर्स OCR लाइब्रेरी है जो विशेष रूप से Swift इकोसिस्टम के लिए डिज़ाइन की गई है, जिससे सॉफ़्टवेयर डेवलपर्स अपने iOS और macOS एप्लिकेशनों में परिष्कृत ऑप्टिकल कैरेक्टर रिकग्निशन को सहजता से एकीकृत कर सकते हैं। शक्तिशाली, उद्योग‑प्रमाणित Tesseract OCR इंजन का उपयोग करके, यह छवियों, स्कैन किए गए दस्तावेज़ों और विभिन्न डिजिटल मीडिया से सटीक रूप से टेक्स्ट निकालने के लिए एक सहज और सुव्यवस्थित Swift इंटरफ़ेस प्रदान करता है। यह Apple पर्यावरण में विश्वसनीय टेक्स्ट स्कैनिंग और रिकग्निशन क्षमताओं की आवश्यकता वाले सरल टेक्स्ट‑रीडिंग यूटिलिटीज़ से लेकर जटिल डेटा प्रोसेसिंग टूल्स तक सभी प्रकार के डेवलपर्स के लिए एक आदर्श आधार बनाता है।
यह लाइब्रेरी Tesseract की कार्यक्षमता को एक सीधा और डेवलपर‑फ्रेंडली API में लपेटकर OCR एकीकरण को सरल बनाती है। यह बॉक्स से बाहर व्यापक बहुमुखी प्रतिभा प्रदान करती है, जिसमें कई भाषाओं के लिए मजबूत समर्थन शामिल है—जो अंतरराष्ट्रीय एप्लिकेशनों के निर्माण के लिए एक महत्वपूर्ण विशेषता है। उच्च सटीकता सुनिश्चित करने के लिए, SwiftyTesseract आवश्यक इमेज प्री‑प्रोसेसिंग क्षमताएँ शामिल करता है जो पहचान से पहले टेक्स्ट स्पष्टता को बढ़ाती हैं। इसके अतिरिक्त, डेवलपर्स प्रमुख Tesseract कॉन्फ़िगरेशन विकल्पों, जैसे OCR इंजन मोड और पेज सेगमेंटेशन मोड, को कस्टमाइज़ करके सूक्ष्म नियंत्रण बनाए रख सकते हैं। उपयोग में आसान, बहु‑भाषा समर्थन और गहरी कस्टमाइज़ेबिलिटी का यह संयोजन SwiftyTesseract को उन सॉफ़्टवेयर डेवलपर्स के लिए एक अनूठी बहुमुखी और शक्तिशाली टूल बनाता है जो विभिन्न टेक्स्ट रिकग्निशन प्रोजेक्ट्स को संभालते हैं।
SwiftyTesseract के साथ शुरूआत
SwiftyTesseract को इंस्टॉल करने का अनुशंसित तरीका CocoaPods का उपयोग करना है। कृपया सुगम इंस्टॉलेशन के लिए निम्न कमांड का उपयोग करें।
CocoaPods के माध्यम से SwiftyTesseract इंस्टॉल करें
pod 'SwiftyTesseract' आप इसे मैन्युअल रूप से भी इंस्टॉल कर सकते हैं; नवीनतम रिलीज़ फ़ाइलें सीधे GitHub रिपॉज़िटरी से डाउनलोड करें।
Swift लाइब्रेरी के माध्यम से छवि पर OCR करें
ओपन सोर्स SwiftyTesseract लाइब्रेरी सॉफ़्टवेयर डेवलपर्स को विभिन्न प्रकार की छवियों को लोड करने और Swift एप्लिकेशनों के भीतर अपनी आवश्यकताओं के अनुसार OCR ऑपरेशन करने में आसान बनाती है। आप अपनी ऐप की एसेट्स या किसी अन्य स्रोत से छवि का उपयोग कर सकते हैं। लाइब्रेरी Serif, Arial, Sans-serif और स्क्रिप्ट फ़ॉन्ट सहित विभिन्न फ़ॉन्ट्स में टेक्स्ट पहचान सकती है। नीचे एक नमूना कोड स्निपेट दिया गया है जो दर्शाता है कि सॉफ़्टवेयर डेवलपर्स Swift एप्लिकेशनों के भीतर छवि से टेक्स्ट कैसे पहचान सकते हैं।
Swift एप्लिकेशन के भीतर छवि से टेक्स्ट कैसे पहचानें?
import SwiftyTesseract
// Load the image
let image = UIImage(named: "image.jpg")!
// Create a Tesseract instance
let tesseract = Tesseract()
// Set the language to English
tesseract.language = "eng"
// Set the image
tesseract.image = image
// Recognize the text
tesseract.recognize() { result in
if let text = result.text {
print("Recognized text: \(text)")
} else {
print("Error recognizing text")
}
}
छवि प्रीप्रोसेसिंग समर्थन
SwiftyTesseract लाइब्रेरी ने Swift एप्लिकेशनों के भीतर OCR ऑपरेशन्स करने से पहले छवियों को प्री‑प्रोसेस करने के लिए पूर्ण समर्थन प्रदान किया है। उदाहरण के लिए, आप छवियों को ग्रेस्केल में बदल सकते हैं, आकार बदल सकते हैं, कंट्रास्ट समायोजित कर सकते हैं, छवि को डि‑स्क्यू कर सकते हैं, बाइनराइज़ेशन आदि कर सकते हैं। नीचे एक उदाहरण दिया गया है जो दिखाता है कि डेवलपर्स OCR करने से पहले छवि का आकार कैसे बदल सकते हैं। इस कोड उदाहरण में, resizeImage छवि को प्रोसेस होने से पहले आकार बदलता है, जो हाई‑रेज़ोल्यूशन छवियों के साथ काम करते समय उपयोगी हो सकता है।
Swift ऐप्स में OCR ऑपरेशन्स से पहले छवियों को कैसे प्रीप्रोसेस करें?
func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
image.draw(in: CGRect(origin: .zero, size: newSize))
let newImage = UIGraphicsGetImageFromCurrentImageContext()
UIGraphicsEndImageContext()
return newImage
}
if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
tesseract.performOCR(on: resizedImage) { recognizedText in
print("Resized Image OCR result: \(recognizedText ?? "No text found")")
}
}
Swift लाइब्रेरी के माध्यम से बहु‑भाषा OCR ऑपरेशन्स
ओपन सोर्स SwiftyTesseract लाइब्रेरी 100 से अधिक भाषाओं में टेक्स्ट पहचान का समर्थन करती है, जिसमें अंग्रेज़ी, स्पेनिश, फ्रेंच, जर्मन, चीनी और कई अन्य शामिल हैं। आप लाइब्रेरी को इनिशियलाइज़ करते समय अपनी पसंद की भाषाएँ सेट कर सकते हैं। यह फीचर अंतरराष्ट्रीय उपयोगकर्ताओं और बहु‑भाषा प्रोसेसिंग आवश्यकताओं के लिए इसकी एप्लिकेशन सीमा को विस्तारित करता है। इसके अलावा, डेवलपर्स कस्टम डिक्शनरी बना सकते हैं ताकि OCR प्रक्रिया की सटीकता बढ़े। नीचे एक उदाहरण दिया गया है जो इंग्लिश और स्पेनिश के लिए लाइब्रेरी को कॉन्फ़िगर करता है। यह कोड मिश्रित‑भाषा सामग्री वाले दस्तावेज़ों को प्रोसेस करते समय उपयोगी है।
Swift ऐप्स में बहु‑भाषा OCR ऑपरेशन्स के लिए भाषाएँ कैसे चुनें?
let tesseract = SwiftyTesseract(language: [.english, .spanish])
कस्टमाइज़ेबल OCR पैरामीटर्स
ओपन सोर्स SwiftyTesseract लाइब्रेरी का उपयोग करके, सॉफ़्टवेयर डेवलपर्स को विशिष्ट प्रकार के दस्तावेज़ों या भाषाओं के लिए सटीकता बढ़ाने हेतु OCR सेटिंग्स को कस्टमाइज़ करने की क्षमता मिलती है। यह डेवलपर्स को OCR प्रोसेस को फाइन‑ट्यून करने की अनुमति देता है, जिससे लाइब्रेरी जटिल या विशिष्ट OCR परिदृश्यों के लिए अनुकूल बनती है। इसमें दस्तावेज़ की आवश्यकताओं के आधार पर भाषाओं और OCR वेरिएबल्स को निर्दिष्ट करने की क्षमता शामिल है। नीचे एक उदाहरण दिया गया है जो दिखाता है कि डेवलपर्स OCR इंजन मोड और पेज सेगमेंटेशन मोड को कैसे कस्टमाइज़ कर सकते हैं।
Swift API के माध्यम से OCR इंजन मोड और पेज सेगमेंटेशन मोड को कैसे कस्टमाइज़ करें?
let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
if let recognizedString = recognizedString {
print("Recognized text with custom PSM: \(recognizedString)")
}
}