1. পণ্য
  2.   OCR
  3.   Swift
  4.   SwiftyTesseract
 
  

ফ্রি Swift OCR লাইব্রেরি স্ক্যান করা ছবি ও PDF-এ OCR সম্পাদনের জন্য

ওপেন সোর্স Swift অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) লাইব্রেরি iOS এবং macOS-এ ক্যামেরা ফটো, স্ক্যান করা ছবি ও PDF থেকে টেক্সট স্ক্যান, স্বীকৃতি এবং এক্সট্র্যাক্ট করতে ফ্রি ভাবে সক্ষম করে

SwiftyTesseract কী?

SwiftyTesseract হল একটি শীর্ষস্থানীয়, ওপেন-সোর্স OCR লাইব্রেরি, যা বিশেষভাবে Swift ইকোসিস্টেমের জন্য ডিজাইন করা হয়েছে, সফটওয়্যার ডেভেলপারদের iOS এবং macOS অ্যাপ্লিকেশনে উন্নত অপটিক্যাল ক্যারেক্টার রিকগনিশন সহজে সংযোজনের ক্ষমতা প্রদান করে। শক্তিশালী, শিল্প-প্রমাণিত Tesseract OCR ইঞ্জিন ব্যবহার করে, এটি ছবি, স্ক্যান করা ডকুমেন্ট এবং বিভিন্ন ডিজিটাল মিডিয়া থেকে সঠিকভাবে টেক্সট বের করার জন্য স্বজ্ঞাত এবং সরলীকৃত Swift ইন্টারফেস সরবরাহ করে। এটি এমন ডেভেলপারদের জন্য আদর্শ ভিত্তি যারা সহজ টেক্সট-রিডিং ইউটিলিটি থেকে জটিল ডেটা প্রসেসিং টুল পর্যন্ত সবকিছু তৈরি করেন, এবং Apple পরিবেশে নির্ভরযোগ্য টেক্সট স্ক্যান ও স্বীকৃতি ক্ষমতা প্রয়োজন।

এই লাইব্রেরি Tesseract-এর কার্যকারিতা একটি সরল ও ডেভেলপার-বন্ধু API-তে মোড়িয়ে OCR সংযোজনকে সহজ করে। এটি আউট-অফ-দ্য-বক্সে ব্যাপক বহুমুখিতা প্রদান করে, যার মধ্যে বহু ভাষার শক্তিশালী সাপোর্ট অন্তর্ভুক্ত—আন্তর্জাতিক অ্যাপ্লিকেশন তৈরির জন্য একটি গুরুত্বপূর্ণ বৈশিষ্ট্য। উচ্চ নির্ভুলতা নিশ্চিত করতে, SwiftyTesseract টেক্সট স্বীকৃতির আগে টেক্সটের স্পষ্টতা বাড়াতে প্রয়োজনীয় ইমেজ প্রিপ্রসেসিং সক্ষমতা অন্তর্ভুক্ত করে। তদুপরি, ডেভেলপাররা OCR ইঞ্জিন মোড এবং পেজ সেগমেন্টেশন মোডের মতো মূল Tesseract কনফিগারেশন অপশন কাস্টমাইজ করে সূক্ষ্ম নিয়ন্ত্রণ বজায় রাখতে পারেন। ব্যবহার সহজতা, বহু-ভাষা সাপোর্ট এবং গভীর কাস্টমাইজেবিলিটির সমন্বয় SwiftyTesseract-কে সফটওয়্যার ডেভেলপারদের জন্য টেক্সট স্বীকৃতি প্রকল্পের বিস্তৃত স্পেকট্রাম মোকাবিলায় একটি অনন্যভাবে বহুমুখী ও শক্তিশালী টুল করে তুলেছে।

Previous Next

SwiftyTesseract দিয়ে শুরু করা

SwiftyTesseract ইনস্টল করার সুপারিশকৃত পদ্ধতি হল CocoaPods ব্যবহার করা। মসৃণ ইনস্টলেশনের জন্য দয়া করে নিম্নলিখিত কমান্ডটি ব্যবহার করুন।

Install SwiftyTesseract via CocoaPods

 pod 'SwiftyTesseract' 

আপনি এটি ম্যানুয়ালি ইনস্টলও করতে পারেন; সর্বশেষ রিলিজ ফাইলগুলি সরাসরি GitHub রেপোজিটরি থেকে ডাউনলোড করুন।

Swift লাইব্রেরি ব্যবহার করে ছবিতে OCR সম্পাদন

ওপেন সোর্স SwiftyTesseract লাইব্রেরি সফটওয়্যার ডেভেলপারদের বিভিন্ন ধরনের ছবি লোড করে তাদের প্রয়োজন অনুসারে Swift অ্যাপ্লিকেশনের মধ্যে OCR অপারেশন সম্পাদন করা সহজ করে। আপনি আপনার অ্যাপের অ্যাসেট থেকে অথবা অন্য কোনো উৎস থেকে ছবি ব্যবহার করতে পারেন। লাইব্রেরি Serif, Arial, Sans-serif এবং স্ক্রিপ্ট ফন্টসহ বিভিন্ন ফন্টের টেক্সট স্বীকৃতি করতে পারে। নিচে একটি নমুনা কোড স্নিপেট দেওয়া হয়েছে, যা দেখায় কীভাবে সফটওয়্যার ডেভেলপাররা Swift অ্যাপ্লিকেশনের মধ্যে ছবি থেকে টেক্সট স্বীকৃতি করতে পারেন।

কীভাবে Swift অ্যাপ্লিকেশনের মধ্যে ছবি থেকে টেক্সট স্বীকৃতি করবেন?

import SwiftyTesseract

// Load the image
let image = UIImage(named: "image.jpg")!

// Create a Tesseract instance
let tesseract = Tesseract()

// Set the language to English
tesseract.language = "eng"

// Set the image
tesseract.image = image

// Recognize the text
tesseract.recognize() { result in
    if let text = result.text {
        print("Recognized text: \(text)")
    } else {
        print("Error recognizing text")
    }
}

ইমেজ প্রিপ্রসেসিং সাপোর্ট

SwiftyTesseract লাইব্রেরি Swift অ্যাপ্লিকেশনের মধ্যে OCR অপারেশন সম্পাদনের আগে ইমেজ প্রিপ্রসেসিংয়ের জন্য সম্পূর্ণ সাপোর্ট প্রদান করে। উদাহরণস্বরূপ, আপনি ইমেজকে গ্রেস্কেল রূপান্তর করতে পারেন, রিসাইজ করতে পারেন, কনট্রাস্ট সামঞ্জস্য করতে পারেন, ইমেজ ডি-স্কিউ করতে পারেন, বাইনারাইজেশন ইত্যাদি করতে পারেন। নিচে একটি উদাহরণ দেওয়া হয়েছে, যা দেখায় কীভাবে ডেভেলপাররা OCR সম্পাদনের আগে ইমেজ রিসাইজ করতে পারেন। এই কোড উদাহরণে, resizeImage ইমেজকে প্রক্রিয়াকরণের আগে রিসাইজ করে, যা উচ্চ রেজোলিউশনের ইমেজের সঙ্গে কাজ করার সময় সহায়ক হতে পারে।

কীভাবে Swift অ্যাপে OCR অপারেশনের আগে ইমেজ প্রিপ্রসেস করবেন?

func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
    UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
    image.draw(in: CGRect(origin: .zero, size: newSize))
    let newImage = UIGraphicsGetImageFromCurrentImageContext()
    UIGraphicsEndImageContext()
    return newImage
}

if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
    tesseract.performOCR(on: resizedImage) { recognizedText in
        print("Resized Image OCR result: \(recognizedText ?? "No text found")")
    }
}

Swift লাইব্রেরি ব্যবহার করে মাল্টি-ল্যাঙ্গুয়েজ OCR অপারেশন

ওপেন সোর্স SwiftyTesseract লাইব্রেরি ১০০টির বেশি ভাষায় টেক্সট স্বীকৃতি সমর্থন করে, যার মধ্যে ইংরেজি, স্প্যানিশ, ফরাসি, জার্মান, চাইনিজ এবং আরও অনেক ভাষা অন্তর্ভুক্ত। লাইব্রেরি ইনিশিয়ালাইজ করার সময় আপনি আপনার পছন্দের ভাষা সেট করতে পারেন। এই বৈশিষ্ট্য আন্তর্জাতিক ব্যবহারকারী এবং মাল্টি-ল্যাঙ্গুয়েজ প্রসেসিং প্রয়োজনীয়তার জন্য এর প্রয়োগের পরিসর বিস্তৃত করে। তদুপরি, ডেভেলপাররা কাস্টম ডিকশনারি তৈরি করে OCR প্রক্রিয়ার নির্ভুলতা বাড়াতে পারেন। নিচে ইংরেজি এবং স্প্যানিশের জন্য লাইব্রেরি কনফিগার করার একটি উদাহরণ দেওয়া হয়েছে। এই কোডটি ইংরেজি এবং স্প্যানিশ উভয় ভাষায় OCR সক্ষম করে, যা মিশ্র-ভাষা কন্টেন্টযুক্ত ডকুমেন্ট প্রসেস করার সময় উপকারী।

কীভাবে Swift অ্যাপে মাল্টি-ল্যাঙ্গুয়েজ OCR অপারেশনের জন্য ভাষা নির্বাচন করবেন?

let tesseract = SwiftyTesseract(language: [.english, .spanish])

কাস্টমাইজেবল OCR প্যারামিটার

ওপেন সোর্স SwiftyTesseract লাইব্রেরি ব্যবহার করে সফটওয়্যার ডেভেলপারদের নির্দিষ্ট ধরণের ডকুমেন্ট বা ভাষার জন্য নির্ভুলতা বাড়াতে OCR সেটিংস কাস্টমাইজ করার ক্ষমতা আছে। এটি ডেভেলপারদের OCR প্রসেস ফাইন-টিউন করতে দেয়, ফলে লাইব্রেরি অনন্য বা জটিল OCR দৃশ্যপটের জন্য অভিযোজ্য হয়। এতে ডকুমেন্টের প্রয়োজন অনুসারে ভাষা এবং OCR ভেরিয়েবল নির্ধারণের ক্ষমতা অন্তর্ভুক্ত। নিচে একটি উদাহরণ দেওয়া হয়েছে, যা দেখায় কীভাবে ডেভেলপাররা OCR ইঞ্জিন মোড এবং পেজ সেগমেন্টেশন মোড কাস্টমাইজ করতে পারেন।

কীভাবে Swift API ব্যবহার করে OCR ইঞ্জিন মোড এবং পেজ সেগমেন্টেশন মোড কাস্টমাইজ করবেন?

let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
    if let recognizedString = recognizedString {
        print("Recognized text with custom PSM: \(recognizedString)")
    }
}
 বাংলা