ओसीआर टेक्स्ट और इमेज प्रोसेसिंग के लिए ओपन सोर्स जावा लाइब्रेरी
एक अग्रणी निःशुल्क जावा लाइब्रेरी जो सॉफ्टवेयर डेवलपर्स को जावा ऐप्स में ओसीआर क्षमताएं जोड़ने और स्कैन की गई छवियों और पीडीएफ फाइलों पर आसानी से टेक्स्ट निकालने के लिए ओसीआर निष्पादित करने की अनुमति देती है।
जावा के लिए एस्प्राइज़ ओसीआर एसडीके एक शक्तिशाली ओपन सोर्स जावा एसडीके है जो स्कैन की गई छवियों, पीडीएफ फाइलों और अन्य दस्तावेजों पर ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) करने की क्षमता प्रदान करता है। अपने उपयोग में आसान जावा एपीआई के साथ, यह एसडीके डेवलपर्स को अपने जावा अनुप्रयोगों में ओसीआर क्षमताओं को जल्दी और आसानी से जोड़ने में मदद कर सकता है। ओसीआर एक बहुत ही उपयोगी तकनीक है जो कंप्यूटर को छवियों या दस्तावेज़ों में टेक्स्ट को पहचानने में सक्षम बनाती है। ओसीआर सॉफ़्टवेयर का उपयोग टेक्स्ट की स्कैन की गई छवियों को डिजिटल टेक्स्ट में परिवर्तित करने के लिए किया जा सकता है जिसे कंप्यूटर द्वारा संपादित, खोजा या संसाधित किया जा सकता है।
एस्प्राइज़ ओसीआर एसडीके में ओसीआर से संबंधित गतिविधियों को संभालने के लिए कई महत्वपूर्ण विशेषताएं शामिल हैं, जैसे तेज़ ओसीआर प्रसंस्करण, कई भाषाओं का समर्थन, एक छवि वृद्धि सुविधा, विभिन्न प्रारूपों में मान्यता प्राप्त पाठ, और भी बहुत कुछ। एसडीके उन्नत ओसीआर तकनीक पर आधारित है जो विभिन्न प्रकार के फ़ॉन्ट और भाषाओं में टेक्स्ट को पहचान सकता है। लाइब्रेरी का उपयोग जावा एप्लेट्स, वेब एप्लिकेशन, स्विंग/जावाएफएक्स घटकों और जेईई एंटरप्राइज अनुप्रयोगों के लिए एप्लिकेशन विकसित करने के लिए किया जा सकता है।
एस्प्राइज़ ओसीआर एसडीके सॉफ्टवेयर डेवलपर्स को सादे टेक्स्ट, खोजने योग्य पीडीएफ और माइक्रोसॉफ्ट वर्ड सहित विभिन्न प्रारूपों में मान्यता प्राप्त टेक्स्ट को आउटपुट करने की अनुमति देता है। एसडीके अंग्रेजी, चीनी, जापानी, अरबी और कई अन्य सहित 100 से अधिक भाषाओं में पाठ को पहचान सकता है। अपनी उन्नत ओसीआर तकनीक, व्यापक भाषा समर्थन और उपयोग में आसान एपीआई के साथ, यह एसडीके डेवलपर्स को ओसीआर एप्लिकेशन बनाते समय समय और प्रयास बचाने में मदद कर सकता है।
जावा के लिए Asprise OCR SDK के साथ शुरुआत करना
जावा के लिए एस्प्राइज़ ओसीआर एसडीके के साथ शुरुआत करना जावा के लिए एस्प्राइज़ ओसीआर एसडीके स्थापित करने का अनुशंसित तरीका मावेन का उपयोग करना है। कृपया सुचारू इंस्टालेशन के लिए निम्नलिखित कमांड का उपयोग करें।
जावा के लिए एस्प्राइज़ ओसीआर एसडीके के लिए मेवेन निर्भरता
<dependencies>
<dependency>
<groupId>com.asprise.ocr</groupId>
<artifactId>java-ocr-api;/artifactId>
<version>[15,)</version>
</dependency>
</dependencies>
GitHub के माध्यम से जावा के लिए Asprise OCR SDK इंस्टॉल करें
git clone https://github.com/Asprise/java-.net-ocr-api-library
जावा के माध्यम से सादे पाठ प्रारूप में पाठ निकालें
जावा के लिए एस्प्राइज़ ओसीआर एसडीके ने सादे पाठ प्रारूप में छवियों से पाठ निकालने के लिए पूर्ण कार्यक्षमता प्रदान की है। लाइब्रेरी उपयोगकर्ताओं को स्कैन किए गए दस्तावेज़ों या छवियों की पाठ्य सामग्री को आसानी से पुनर्प्राप्त करने और आगे की प्रक्रिया या विश्लेषण के लिए इसका उपयोग करने की अनुमति देती है। सादा पाठ निकालने के कार्य को प्राप्त करने के लिए सबसे पहले आपको छवि को फ़ाइल, इनपुट स्ट्रीम या यूआरएल से लोड करना होगा और एपीआई का उपयोग करके लोड की गई छवि पर ओसीआर पहचान लागू करना होगा। सादे पाठ प्रारूप में मान्यता प्राप्त पाठ को पुनः प्राप्त करने के लिए उपयुक्त फ़ंक्शन का उपयोग करें। निम्नलिखित दिखाता है कि एक छवि को कैसे लोड किया जाए, और पाठ को सादे पाठ के रूप में पहचाना जाए, और परिणाम कंसोल पर मुद्रित किया जाए।
जावा एपीआई के माध्यम से छवि और मान्यता प्राप्त टेक्स्ट लोड करें
import com.asprise.ocr.Ocr;
public class OCRTest {
public static void main(String[] args) throws Exception {
// Load image from file
Ocr ocr = new Ocr();
ocr.startEngine("eng", Ocr.SPEED_FASTEST);
String recognizedText = ocr.recognize(new File("image.png"), Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);
// Print the plain text output
System.out.println("Recognized Text: " + recognizedText);
ocr.stopEngine();
}
}
जावा ऐप्स में विभिन्न OCR ऑपरेशन निष्पादित करें
जावा एपीआई के लिए एस्प्राइज़ ओसीआर एसडीके सॉफ्टवेयर डेवलपर्स को विभिन्न प्रकार के दस्तावेज़ों पर विभिन्न ओसीआर (ऑप्टिकल कैरेक्टर रिकग्निशन) संचालन करने की अनुमति देता है। लाइब्रेरी विभिन्न प्रकार के ओसीआर ऑपरेशनों का पूरी तरह से समर्थन करती है, जैसे ओसीआर छवि फ़ाइलें, ओसीआर पीडीएफ फाइलें, ओसीआर हस्तलिखित पाठ, ओसीआर एकाधिक भाषाएं, छवि के हिस्से पर ओसीआर निष्पादित करना, एक ही बार में एकाधिक इनपुट फ़ाइलों पर ओसीआर निष्पादित करना, एक पर ओसीआर निष्पादित करना निर्दिष्ट TIFF फ़ाइल से कुछ पृष्ठ, OCR बैच प्रोसेसिंग और बहुत कुछ। पुस्तकालय विभिन्न प्रकार के दस्तावेजों पर ओसीआर संचालन करने के लिए एक शक्तिशाली और लचीला उपकरण प्रदान करता है। कई भाषाओं, छवि और पीडीएफ फाइलों, हस्तलिखित पाठ और बैच प्रोसेसिंग के लिए इसके समर्थन से, आप अपने दस्तावेज़ों से पाठ को जल्दी और सटीक रूप से निकाल सकते हैं।
जावा लाइब्रेरी के माध्यम से एकाधिक फ़ाइलों पर OCR निष्पादित करें
String s = ocr.recognize("test.png;test2.jpg", -1, 0, 0, 400, 200,
Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);
perform OCR on a PDF input file:
String s = ocr.recognize("test.pdf", -1, 100, 100, 400, 200,
Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);
एस्प्राइज़ OCR का उपयोग करके मल्टी-थ्रेडिंग समर्थन
जावा एपीआई के लिए एस्प्राइज़ ओसीआर एसडीके में मल्टी-थ्रेडिंग के लिए पूर्ण समर्थन शामिल है, जो डेवलपर्स को एक साथ कई ओसीआर कार्यों को संसाधित करने की अनुमति देता है। यह सुविधा डेवलपर्स को कई थ्रेड्स में ओसीआर प्रोसेसिंग वितरित करके अपने ओसीआर अनुप्रयोगों के प्रदर्शन को बेहतर बनाने में सक्षम बनाती है, जो कई कोर या प्रोसेसर पर एक साथ चल सकती है। मल्टी-थ्रेडिंग समर्थन अत्यधिक अनुकूलन योग्य है, जो डेवलपर्स को उपलब्ध संसाधनों और प्रसंस्करण आवश्यकताओं से मेल खाने के लिए थ्रेड्स और ओसीआर इंजनों की संख्या को ठीक करने की अनुमति देता है। मोटे तौर पर, जावा के मल्टी-थ्रेडिंग समर्थन के लिए एस्प्राइज़ ओसीआर एसडीके डेवलपर्स को उच्च-प्रदर्शन वाले ओसीआर अनुप्रयोगों के निर्माण के लिए एक शक्तिशाली और लचीला उपकरण प्रदान करता है जो बड़ी मात्रा में पाठ को जल्दी और कुशलता से संसाधित कर सकता है।
ट्रिकी थ्रेड मैनेजमेंट कोड लिखना
OcrExecutorService oes =
new OcrExecutorService("eng", Ocr.SPEED_FASTEST, 4); // 4 threads
List> futures = oes.invokeAll(Arrays.asList(
new OcrExecutorService.OcrCallable(
new File[] {new File("test1.png")},
Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML),
new OcrExecutorService.OcrCallable(
new File[] {new File("test2.png")},
Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML)
);
System.out.println("Result of test1.png: " + futures.get(0).get());
System.out.println("Result of test2.png: " + futures.get(1).get());
oes.shutdown(); // stops all OCR engines and disposes all threads