Perpustakaan Java Sumber Terbuka untuk Pemrosesan Teks & Gambar OCR
Perpustakaan Java Gratis Terkemuka yang memungkinkan Pengembang Perangkat Lunak Menambahkan Kemampuan OCR ke aplikasi Java & Melakukan OCR pada Gambar yang Dipindai & File PDF untuk Mengekstrak Teks darinya dengan mudah.
Asprise OCR SDK untuk Java adalah SDK Java sumber terbuka yang kuat dan menyediakan kemampuan untuk melakukan pengenalan karakter optik (OCR) pada gambar yang dipindai, file PDF, dan dokumen lainnya. Dengan Java API yang mudah digunakan, SDK ini dapat membantu pengembang menambahkan kemampuan OCR ke aplikasi Java mereka dengan cepat dan mudah. OCR adalah teknologi yang sangat berguna yang memungkinkan komputer mengenali teks dalam gambar atau dokumen. Perangkat lunak OCR dapat digunakan untuk mengubah gambar teks yang dipindai menjadi teks digital yang dapat diedit, dicari, atau diproses oleh komputer.
Asprise OCR SDK telah menyertakan beberapa fitur penting untuk menangani aktivitas terkait OCR, seperti pemrosesan OCR yang cepat, dukungan beberapa bahasa, fasilitas peningkatan gambar, teks yang dikenali dalam berbagai format, dan banyak lagi. SDK ini didasarkan pada teknologi OCR canggih yang dapat mengenali teks dalam berbagai font dan bahasa. Pustaka dapat digunakan untuk mengembangkan aplikasi untuk applet Java, aplikasi web, komponen Swing/JavaFX, dan aplikasi perusahaan JEE.
Asprise OCR SDK memungkinkan pengembang perangkat lunak mengeluarkan teks yang dikenali dalam berbagai format, termasuk teks biasa, PDF yang dapat dicari, dan Microsoft Word. SDK dapat mengenali teks dalam lebih dari 100 bahasa, termasuk Inggris, China, Jepang, Arab, dan banyak lagi. Dengan teknologi OCR yang canggih, dukungan bahasa yang komprehensif, dan API yang mudah digunakan, SDK ini dapat membantu developer menghemat waktu dan tenaga saat membuat aplikasi OCR.
Memulai Asprise OCR SDK untuk Java
Memulai Asprise OCR SDK untuk Java Cara yang disarankan untuk menginstal Asprise OCR SDK for Java adalah menggunakan Maven. Silakan gunakan perintah berikut untuk kelancaran instalasi.
Ketergantungan Maven untuk Asprise OCR SDK untuk Java
<dependencies>
<dependency>
<groupId>com.asprise.ocr</groupId>
<artifactId>java-ocr-api;/artifactId>
<version>[15,)</version>
</dependency>
</dependencies>
Instal Asprise OCR SDK untuk Java melalui GitHub
git clone https://github.com/Asprise/java-.net-ocr-api-library
Ekstrak Teks dalam Format Teks Biasa melalui Java
Asprise OCR SDK untuk Java telah menyediakan fungsionalitas lengkap untuk mengekstraksi teks dari gambar dalam format teks biasa. Perpustakaan memungkinkan pengguna dengan mudah mengambil konten teks dari dokumen atau gambar yang dipindai, dan menggunakannya untuk pemrosesan atau analisis lebih lanjut. Untuk mencapai tugas ekstraksi teks biasa, pertama-tama Anda perlu memuat gambar dari file, aliran input, atau URL dan menerapkan pengenalan OCR ke gambar yang dimuat menggunakan API. Gunakan fungsi yang sesuai untuk mengambil teks yang dikenali dalam format teks biasa. Berikut ini menunjukkan cara memuat gambar, dan mengenali teks sebagai teks biasa, dan hasilnya dicetak ke konsol.
Muat Gambar, & Teks yang Dikenali melalui Java API
import com.asprise.ocr.Ocr;
public class OCRTest {
public static void main(String[] args) throws Exception {
// Load image from file
Ocr ocr = new Ocr();
ocr.startEngine("eng", Ocr.SPEED_FASTEST);
String recognizedText = ocr.recognize(new File("image.png"), Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);
// Print the plain text output
System.out.println("Recognized Text: " + recognizedText);
ocr.stopEngine();
}
}
Melakukan Berbagai Operasi OCR di Aplikasi Java
Asprise OCR SDK untuk Java API memungkinkan pengembang perangkat lunak melakukan berbagai operasi OCR (Optical Character Recognition) pada berbagai jenis dokumen. Perpustakaan sepenuhnya mendukung berbagai jenis operasi OCR, seperti File Gambar OCR, File PDF OCR, Teks Tulisan Tangan OCR, OCR Berbagai Bahasa, melakukan OCR pada sebagian gambar, melakukan OCR pada beberapa file masukan dalam satu pengambilan, melakukan OCR pada beberapa halaman tertentu dari file TIFF yang ditentukan, OCR Batch Processing dan masih banyak lagi. Perpustakaan menyediakan alat yang ampuh dan fleksibel untuk melakukan operasi OCR pada berbagai jenis dokumen. Dengan dukungannya untuk berbagai bahasa, file gambar dan PDF, teks tulisan tangan, dan pemrosesan batch, Anda dapat mengekstrak teks dari dokumen Anda dengan cepat dan akurat.
Lakukan OCR pada Banyak File melalui Java Library
String s = ocr.recognize("test.png;test2.jpg", -1, 0, 0, 400, 200,
Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);
perform OCR on a PDF input file:
String s = ocr.recognize("test.pdf", -1, 100, 100, 400, 200,
Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);
Dukungan multi-threading menggunakan Asprise OCR
Asprise OCR SDK untuk Java API telah menyertakan dukungan lengkap untuk multi-threading, yang memungkinkan pengembang memproses beberapa tugas OCR secara bersamaan. Fitur ini memungkinkan pengembang untuk meningkatkan kinerja aplikasi OCR mereka dengan mendistribusikan pemrosesan OCR ke beberapa thread, yang dapat berjalan secara bersamaan pada beberapa core atau prosesor. Dukungan multi-threading sangat dapat disesuaikan, memungkinkan pengembang untuk menyesuaikan jumlah thread dan mesin OCR agar sesuai dengan sumber daya yang tersedia dan persyaratan pemrosesan. Secara umum, dukungan multi-threading Asprise OCR SDK untuk Java memberi pengembang alat yang kuat dan fleksibel untuk membangun aplikasi OCR berkinerja tinggi yang dapat memproses teks dalam jumlah besar dengan cepat dan efisien.
Menulis Kode Manajemen thread yang Rumit
OcrExecutorService oes =
new OcrExecutorService("eng", Ocr.SPEED_FASTEST, 4); // 4 threads
List> futures = oes.invokeAll(Arrays.asList(
new OcrExecutorService.OcrCallable(
new File[] {new File("test1.png")},
Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML),
new OcrExecutorService.OcrCallable(
new File[] {new File("test2.png")},
Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML)
);
System.out.println("Result of test1.png: " + futures.get(0).get());
System.out.println("Result of test2.png: " + futures.get(1).get());
oes.shutdown(); // stops all OCR engines and disposes all threads