টেক্সট ও ইমেজ প্রসেস করতে OCR-এর জন্য ওপেন সোর্স .NET API
ওপেন সোর্স .NET অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) এপিআই মেশিন-পাঠযোগ্য পাঠ্যে টেক্সট ধারণকারী ছবি (স্ক্যান করা ছবি এবং পিডিএফ ফাইল) রূপান্তর করতে ব্যবহৃত হয়।
টেসার্যাক্ট হল একটি অত্যন্ত শক্তিশালী ওপেন সোর্স অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) ইঞ্জিন যা সফ্টওয়্যার ডেভেলপারদের পাইথন অ্যাপ্লিকেশনের ভিতরে টেক্সট সহ বিভিন্ন ধরনের ছবিকে মেশিন-পঠনযোগ্য পাঠ্যে রূপান্তর করতে সক্ষম করে। ওপেন সোর্স প্রযুক্তি সফ্টওয়্যার বিকাশকারীরা তাদের অ্যাপ্লিকেশনগুলিকে তাদের অ্যাপ্লিকেশনগুলির মধ্যে শক্তিশালী সরঞ্জাম এবং লাইব্রেরিগুলি অ্যাক্সেস এবং একীভূত করার মাধ্যমে তাদের অ্যাপ্লিকেশনগুলিকে তৈরি করার পদ্ধতিতে বিপ্লব করেছে৷ এটি tesseract-ocr-এর জন্য একটি .NET র্যাপার এবং ডকুমেন্ট স্ক্যানিং এবং ডেটা এক্সট্র্যাকশন থেকে স্বয়ংক্রিয় চিত্র সনাক্তকরণ এবং অনুবাদ পর্যন্ত বিস্তৃত অ্যাপ্লিকেশনগুলিতে ব্যবহার করা যেতে পারে৷
Tesseract মূলত 1980 সালে Hewlett-Packard দ্বারা বিকশিত হয়েছিল এবং পরে 2005 সালে একটি ওপেন সোর্স প্রজেক্ট হিসাবে প্রকাশ করা হয়েছিল। তখন থেকে, এটি ইউনিকোড (UTF) এর সমর্থন সহ বিশ্বের সর্বাধিক ব্যবহৃত ওসিআর ইঞ্জিনগুলির মধ্যে একটি হয়ে উঠেছে। -8), 100 টিরও বেশি ভাষা এবং বিস্তৃত চিত্র বিন্যাস প্রক্রিয়া করার ক্ষমতা। API এর বিভিন্ন বৈশিষ্ট্য রয়েছে যেমন ডকুমেন্ট স্ক্যানিং, ডকুমেন্ট ডিজিটাইজেশন, ডকুমেন্ট সার্চযোগ্য করা, মেশিন রিডেবল ডকুমেন্ট তৈরি করা, OCR পারফরম্যান্স অপ্টিমাইজ করা এবং আরও অনেক কিছু।
টেসার্যাক্ট হ্যান্ডেল করা খুবই সহজ এবং ডিজিটাল ইমেজের মধ্যে টেক্সট শনাক্ত করার জন্য ডিজাইন করা হয়েছে বিস্তৃত ইমেজ ফরম্যাটে, যেমন JPEG, BMP, PSD, PNG, TIFF এবং আরও অনেক কিছুতে। লাইব্রেরিটি অত্যন্ত কাস্টমাইজযোগ্য, বিস্তৃত বিকল্পগুলির সাথে যা বিভিন্ন ধরণের চিত্র এবং পাঠ্যের জন্য OCR কার্যকারিতা অপ্টিমাইজ করতে ব্যবহার করা যেতে পারে। আপনি ডকুমেন্ট স্ক্যানিং এবং ডিজিটাইজেশন, ডেটা এক্সট্র্যাকশন, বা ইমেজ রিকগনিশন এবং অনুবাদ নিয়ে কাজ করছেন না কেন, Tesseract একটি শক্তিশালী এবং নির্ভরযোগ্য সমাধান অফার করে যা আপনাকে দ্রুত এবং সহজে আপনার লক্ষ্য অর্জনে সাহায্য করতে পারে।
Tesseract দিয়ে শুরু করা
Tesseract ইনস্টল করার প্রস্তাবিত উপায় হল NuGet ব্যবহার করা। একটি মসৃণ ইনস্টলেশনের জন্য অনুগ্রহ করে নিম্নলিখিত কমান্ডটি ব্যবহার করুন।
NuGet এর মাধ্যমে Tesseract ইনস্টল করুন
Install-Package Tesseract
GitHub এর মাধ্যমে Tesseract ইনস্টল করুন
git clone https://github.com/charlesw/tesseract.git
C# এর মাধ্যমে একটি চিত্র থেকে মৌলিক পাঠ্য বের করুন
ওপেন সোর্স C# লাইব্রেরি Tesseract সফ্টওয়্যার ডেভেলপারদের তাদের নিজস্ব .NET অ্যাপ্লিকেশনের মধ্যে একটি ইমেজ থেকে পাঠ্য বের করতে সক্ষম করে। লাইব্রেরিটি সফ্টওয়্যার বিকাশকারীদের জন্য সহজে স্ক্যান করা নথি বা চিত্রগুলির পাঠ্য বিষয়বস্তু পুনরুদ্ধার করা এবং এটি আরও প্রক্রিয়াকরণ বা বিশ্লেষণের জন্য ব্যবহার করা সহজ করে তোলে। টাস্কটি অর্জন করতে প্রথমে ডেভেলপারদের আপনার কোড ফাইলে Tesseract নামস্থান আমদানি করতে হবে এবং Tesseract ইঞ্জিনের একটি উদাহরণ তৈরি করতে হবে। নিচের উদাহরণে দেখানো হয়েছে কিভাবে ইমেজ থেকে বেসিক টেক্সট বের করা যায় এবং কনসোলে আউটপুট করা যায়।
কিভাবে C# API এর মাধ্যমে ইমেজ থেকে বেসিক টেক্সট এক্সট্রাক্ট করবেন?
using Tesseract;
using System.Drawing;
namespace MyNamespace
{
class Program
{
static void Main(string[] args)
{
var engine = new TesseractEngine("./tessdata", "eng", EngineMode.Default);
var image = new Bitmap(@"C:\path\to\your\image.jpg");
var page = engine.Process(image);
var text = page.GetText();
image.Dispose();
page.Dispose();
engine.Dispose();
Console.WriteLine(text);
}
}
}
চিত্রকে C# .NET এর মাধ্যমে অনুসন্ধানযোগ্য PDF এ রূপান্তর করুন
ওপেন সোর্স C# লাইব্রেরি Tesseract C# কোড ব্যবহার করে অনুসন্ধানযোগ্য পিডিএফ নথিতে ছবি রূপান্তর করার জন্য কিছু দরকারী বৈশিষ্ট্য অন্তর্ভুক্ত করেছে। লাইব্রেরীতে বিভিন্ন আউটপুট ফরম্যাট যেমন প্লেইন টেক্সট, hOCR (HTML), PDF, অদৃশ্য-পাঠ্য-শুধু PDF, TSV, ALTO এবং আরও অনেক কিছুর জন্য সমর্থন অন্তর্ভুক্ত রয়েছে। অনুগ্রহ করে মনে রাখবেন যে আরও ভাল OCR ফলাফল পেতে, বিকাশকারীকে তারা Tesseract কে যে চিত্রগুলি সরবরাহ করতে চলেছে তার গুণমান উন্নত করতে হবে। নীচের উদাহরণটি দেখায় কিভাবে চিত্র থেকে স্বীকৃত পাঠ্য সহ একটি অনুসন্ধানযোগ্য PDF নথি তৈরি করতে হয়৷
৷কিভাবে C# .NET ব্যবহার করে চিত্রকে অনুসন্ধানযোগ্য PDF এ রূপান্তর করবেন
using (var engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.Default))
{
using (var img = Pix.LoadFromFile(testImagePath))
{
using (var page = engine.Process(img))
{
var text = page.GetText();
Console.WriteLine("Mean confidence: {0}", page.GetMeanConfidence());
Console.WriteLine("Text (GetText): \r\n{0}", text);
Console.WriteLine("Text (iterator):");
}
}
}
FORMAT_PLAINTEXT);