चाइनीज़ पांडुलिपियों के लिए मुफ्त ऑप्टिकल कैरेक्टर रिकग्निशन एपीआई

ओपन सोर्स C++ ओसीआर जो टेम्पलेट-आधारित मिलान का उपयोग करके चाइनीज़ पांडुलिपियों पर ओसीआर ऑपरेशन्स करता है, जहाँ अक्षरों को ज्ञात नमूनों के विरुद्ध पिक्सेल-वार मिलाया जाता है।

मुफ़्त C++ ओसीआर क्या है?

ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) गैर-लैटिन स्क्रिप्ट्स—विशेष रूप से चाइनीज़—में अक्षरों की जटिलता और विविधता के कारण अद्वितीय चुनौतियों का सामना करता है। सौभाग्य से, सेबेस्टियन स्टार्के द्वारा विकसित ओपन-सोर्स OCR C++ API प्रिंटेड या हस्तलिखित चाइनीज़ अक्षरों को पहचानने के लिए एक साफ़, विस्तारणीय समाधान प्रदान करता है, विशेष रूप से पांडुलिपि स्रोतों से। सरलता और अनुकूलनशीलता को ध्यान में रखकर डिज़ाइन किया गया यह हल्का API सॉफ़्टवेयर डेवलपर्स को भारी मशीन लर्निंग मॉडल के बजाय क्लासिकल इमेज प्रोसेसिंग विधियों का उपयोग करके कैरेक्टर रिकग्निशन के साथ प्रयोग करने की सुविधा देता है।

यह प्रोजेक्ट टेस्सरैक्ट जैसी पूर्ण-स्तरीय न्यूरल OCR इंजन नहीं है। इसके बजाय यह एक अलग मार्ग अपनाता है: यह टेम्पलेट-आधारित मिलान का उपयोग करता है, जहाँ अक्षरों को ज्ञात नमूनों के विरुद्ध पिक्सेल-वार मिलाया जाता है। यह शैक्षिक उपयोग, नियंत्रित वातावरण, या ऐतिहासिक पांडुलिपि विश्लेषण, पारंपरिक चाइनीज़ टाइपसेट, या सरल हस्तलेख डेटासेट जैसे विशिष्ट पहचान कार्यों के लिए आदर्श बनाता है। यह प्रोजेक्ट विशेष रूप से उन डेवलपर्स के लिए उपयुक्त है जो एम्बेडेड लिनक्स सिस्टम, रास्पबेरी पाई, या औद्योगिक स्कैनिंग डिवाइस जैसे कम-संसाधन वाले वातावरण में काम करते हैं, क्योंकि यह भारी निर्भरताओं या डीप लर्निंग लाइब्रेरीज़ पर निर्भर नहीं करता।

एक नज़र में

ओसीआर सुविधाओं का एक अवलोकन।

फ़ीचर अवलोकन

चाइनीज़-ओसीआर
ओसीआर क्षमताएँ जोड़ें
छवि पाठ को पहचानें
पाठ की छवियों को परिवर्तित करें
पहचाना गया फ़ॉन्ट पाठ
अन्य भाषाओं का समर्थन
ओसीआर ऐप्स बनाएं
छवि पूर्व-प्रसंस्करण
पाठ निकालें
मल्टी-थ्रेडिंग समर्थन

OCR

OCR नीचे सूचीबद्ध लोकप्रिय इमेज फ़ाइल फ़ॉर्मेट का समर्थन करता है।

रीडर

PNG, JPEG, BMP, TIFF, TGA, DICOM

राइटर

PNG, JPEG, BMP, TIFF

OCR

प्लेटफ़ॉर्म स्वतंत्रता

OCR किसी भी C++ आधारित प्रोग्रामिंग भाषा के साथ काम कर सकता है।

C++ रनटाइम।

OCR

ओसीआर के साथ शुरुआत

ओसीआर स्थापित करने का अनुशंसित तरीका GitHub का उपयोग करना है। सुगम इंस्टॉलेशन के लिए कृपया नीचे दिया गया कमांड उपयोग करें।

GitHub के माध्यम से ओसीआर एपीआई स्थापित करें

 git clone https://github.com/sebastianstarke/OCR.git

आप इसे मैन्युअल रूप से भी स्थापित कर सकते हैं; नवीनतम रिलीज़ फ़ाइलें सीधे GitHub रिपॉज़िटरी से डाउनलोड करें।

टेम्पलेट-आधारित ओसीआर इंजन

चाइनीज़ पांडुलिपियों में ओपन सोर्स ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) C++ एपीआई ने C++ ऐप्स के भीतर टेम्पलेट-आधारित ओसीआर इंजन का उपयोग करने के लिए पूर्ण समर्थन प्रदान किया है। इस लाइब्रेरी के हृदय में एक क्लासिक इमेज तुलना प्रणाली है: कैरेक्टर इमेज को बाइनराइज़ किया जाता है और फिर टेम्पलेट्स के विरुद्ध दूरी मीट्रिक (आमतौर पर पिक्सेल-वार तुलना) का उपयोग करके तुलना की जाती है। चाइनीज़ के लिए, यह लगातार लेखनी या प्रिंटेड पांडुलिपियों से निपटने पर विशेष रूप से उपयोगी है।

C++ ऐप्स में टेम्पलेट-आधारित ओसीआर रिकग्निशन कैसे करें?

OCR::TemplateCollection templates;
templates.loadFromFolder("templates/"); // Load preprocessed characters

OCR::Recognizer recognizer(templates);
std::string recognizedText = recognizer.recognizeFromImage("scanned_page.png");

छवि पूर्व-प्रसंस्करण समर्थन

ओपन सोर्स OCR लाइब्रेरी ने C++ अनुप्रयोगों के भीतर छवि पूर्व-प्रसंस्करण कार्यक्षमता के लिए पूर्ण समर्थन प्रदान किया है। लाइब्रेरी बुनियादी पूर्व-प्रसंस्करण जैसे थ्रेशहोल्डिंग और क्रॉपिंग प्रदान करती है ताकि शोरयुक्त इनपुट को साफ़ किया जा सके। चाइनीज़ पांडुलिपियां अक्सर पुरानी कागज़ पर लिखी होती हैं, इसलिए सटीक परिणामों के लिए छवि सफाई आवश्यक है। निम्न उदाहरण दर्शाता है कि कैसे केवल कुछ पंक्तियों के C++ कोड के साथ सॉफ़्टवेयर डेवलपर्स छवि पूर्व-प्रसंस्करण कर सकते हैं।

C++ ऐप्स में ओसीआर ऑपरेशन्स से पहले छवि पूर्व-प्रसंस्करण कैसे करें?

OCR::ImageProcessor processor;
cv::Mat cleanImage = processor.binarize("raw_scan.png");

आकारात्मक परिवर्तन समर्थन

प्रक्रिया एक श्रृंखला के आकारात्मक परिवर्तनों से शुरू होती है। ये मूलभूत इमेज प्रोसेसिंग ऑपरेशन हैं जो इमेज में फीचर्स की ज्यामिति को बदलते हैं। इस संदर्भ में, इन्हें पांडुलिपि इमेज को साफ़ करने, शोर हटाने, और कैरेक्टर को सेगमेंटेशन के लिए तैयार करने के लिए उपयोग किया जाता है।