Aspose.OCR for Java
API Java OCR Teratas untuk Menambahkan Operasi Pengenalan Karakter Optik
Java API Terkemuka Memungkinkan Membangun aplikasi dengan kemampuan Optical Character Recognition (OCR). Baca, Kenali Teks dari Dokumen yang Dipindai, Gambar & File lainnya melalui Perpustakaan Java.
Aspose.OCR untuk Java adalah mesin OCR (Optical Character Recognition) terkemuka yang memberi pengembang perangkat lunak kemampuan untuk mengintegrasikan fungsi pengenalan teks ke dalam aplikasi Java mereka. Ini dirancang sangat mudah untuk ditangani dan memungkinkan pengembang perangkat lunak mengenali teks dari dokumen yang dipindai, gambar, dan sumber lainnya, dan dapat digunakan untuk mengekstrak teks dari berbagai format file, termasuk JPEG, PNG, BMP, TIFF, HTML, PDF dan masih banyak lainnya.
Aspose.OCR untuk Java menggunakan algoritme OCR tingkat lanjut untuk mengenali teks dari gambar secara akurat, bahkan dalam pindaian atau foto berkualitas rendah. Ini sudah termasuk dukungan untuk lebih dari 50 bahasa berbeda, termasuk Inggris, Spanyol, Perancis, Jerman, Cina dan banyak lagi. Ada beberapa fitur penting bagian dari perpustakaan seperti Pengenalan Teks tulisan tangan, mengekstrak teks dari tangkapan layar, mengekstrak teks dari area tertentu pada gambar, membuat PDF yang dapat dicari, dukungan foto ponsel cerdas, dukungan penghilangan noise, dukungan binarisasi gambar, Peningkatan Aksesibilitas, dan banyak lagi lagi.
Aspose.OCR untuk Java menggunakan algoritme OCR canggih yang dapat mengenali teks dari gambar secara akurat, bahkan dalam pindaian atau foto berkualitas rendah. Perpustakaan dapat meningkatkan aksesibilitas bagi pengguna dengan mengubah dokumen yang dipindai menjadi dokumen digital yang dapat dicari dengan mudah. Dengan algoritme OCR yang canggih, dukungan berbagai bahasa, dan integrasi yang mudah, Aspose.OCR untuk Java dengan cepat menjadi perangkat lunak OCR pilihan bagi pengembang yang ingin menambahkan fungsionalitas OCR ke aplikasi Java mereka.
Memulai Aspose.OCR untuk Java
Cara yang disarankan untuk menginstal Aspose.OCR untuk Java adalah menggunakan Repositori Maven. Silakan gunakan perintah berikut untuk kelancaran instalasi.
Instal Aspose.OCR untuk Java melalui Repositori Maven
<repositories>
<repository>
<Id>AsposeJavaAPI</Id>
<name>Aspose Java API;/name>
<url>http://repository.aspose.com/repo/</url>
</repository>
</repositories>
Anda dapat mendownload pustakanya langsung dari Aspose.OCR halaman produk
Ekstrak Teks dari Gambar melalui Python API
Aspose.OCR untuk Java telah menyertakan fitur yang sangat berguna yang memungkinkan pengembang perangkat lunak mengekstrak teks dari berbagai jenis gambar di dalam aplikasi Python. Perpustakaan telah menyertakan dukungan untuk membaca teks dari gambar raster seperti JPEG, PNG, WBMP, BMP, GIF dan banyak lagi. Ada fitur berguna lainnya di perpustakaan untuk menangani ekstraksi teks seperti membaca teks dari gambar TIFF multi-halaman, mengekstraksi teks dari susunan piksel, Membaca gambar dalam mode pengenalan tercepat, mengenali satu baris, mengekstraksi teks dari tanda terima, dan banyak lagi. Contoh berikut menunjukkan cara mengekstrak teks dari gambar menggunakan perintah Java.
Bagaimana Cara Mengekstrak Teks dari Gambar menggunakan Java API?
AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();
Baca Area Tertentu pada Gambar melalui Java API
Aspose.OCR untuk Java adalah perpustakaan OCR berguna yang memungkinkan pengembang perangkat lunak menemukan dan membaca hanya area tertentu dari suatu gambar, tidak semua teks menggunakan beberapa baris kode Java. Ini adalah fitur yang sangat berguna dan bisa sangat membantu dalam pemrosesan batch untuk dokumen seragam seperti visa, SIM, KTP, dan sebagainya. Ini mendukung fitur seperti mengekstraksi teks di dalam gambar persegi panjang, mengekstraksi garis dengan koordinat, pencarian otomatis untuk kotak pembatas kata dan garis, dan banyak lagi. Contoh berikut menunjukkan cara mengekstrak teks di dalam persegi panjang menggunakan kode Java.
Bagaimana Cara Mengekstrak Teks di dalam Persegi Panjang melalui Java API?
AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));
Pilih Area Spesifik Dokumen melalui Java API
Gambar dokumen mungkin berisi banyak blok dari berbagai konten seperti paragraf teks, gambar, diagram, rumus, tabel, peta, dan sebagainya. Aspose.OCR untuk Java memungkinkan pengembang perangkat lunak memilih dan mendeteksi area tertentu yang diinginkan pada halaman dengan mudah dan melakukan operasi OCR di dalamnya. Perpustakaan mendukung deteksi area otomatis dan Anda dapat menggantinya dengan memilih area minat secara manual. Contoh berikut menunjukkan bagaimana pengembang perangkat lunak dapat mengaktifkan deteksi area dokumen otomatis di dalam aplikasi Java mereka.
Deteksi Area Dokumen Otomatis melalui Java API
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");