Perpustakaan Java Sumber Terbuka untuk Pemprosesan Teks & Imej OCR
Perpustakaan Java Percuma Terkemuka yang membenarkan Pembangun Perisian Menambah Keupayaan OCR pada apl Java & Lakukan OCR pada Imej Imbasan & Fail PDF untuk Mengekstrak Teks daripadanya dengan mudah.
OCR SDK Asprise untuk Java ialah Java SDK sumber terbuka yang berkuasa menyediakan keupayaan untuk melaksanakan pengecaman aksara optik (OCR) pada imej yang diimbas, fail PDF dan dokumen lain. Dengan API Java yang mudah digunakan, SDK ini boleh membantu pembangun menambah keupayaan OCR pada aplikasi Java mereka dengan cepat dan mudah. OCR ialah teknologi yang sangat berguna yang membolehkan komputer mengenali teks dalam imej atau dokumen. Perisian OCR boleh digunakan untuk menukar imej teks yang diimbas kepada teks digital yang boleh diedit, dicari atau diproses oleh komputer.
OCR SDK Asprise telah menyertakan beberapa ciri penting untuk mengendalikan aktiviti berkaitan OCR, seperti pemprosesan OCR yang pantas, sokongan beberapa bahasa, kemudahan peningkatan Imej, teks yang diiktiraf dalam pelbagai format dan banyak lagi. SDK adalah berdasarkan teknologi OCR canggih yang boleh mengecam teks dalam pelbagai jenis fon dan bahasa. Perpustakaan boleh digunakan untuk membangunkan aplikasi untuk applet Java, aplikasi web, komponen Swing/JavaFX dan aplikasi perusahaan JEE.
OCR SDK Asprise membenarkan pembangun perisian mengeluarkan teks yang diiktiraf dalam pelbagai format, termasuk teks biasa, PDF boleh dicari dan Microsoft Word. SDK boleh mengecam teks dalam lebih 100 bahasa, termasuk bahasa Inggeris, Cina, Jepun, Arab dan banyak lagi. Dengan teknologi OCR termaju, sokongan bahasa yang komprehensif dan API yang mudah digunakan, SDK ini boleh membantu pembangun menjimatkan masa dan usaha semasa membina aplikasi OCR.
Bermula dengan Asprise OCR SDK untuk Java
Bermula dengan Asprise OCR SDK untuk Java Cara yang disyorkan untuk memasang Asprise OCR SDK untuk Java menggunakan Maven. Sila gunakan arahan berikut untuk pemasangan yang lancar.
Ketergantungan Maven untuk Asprise OCR SDK untuk Java
<dependencies>
<dependency>
<groupId>com.asprise.ocr</groupId>
<artifactId>java-ocr-api;/artifactId>
<version>[15,)</version>
</dependency>
</dependencies>
Pasang Asprise OCR SDK untuk Java melalui GitHub
git clone https://github.com/Asprise/java-.net-ocr-api-library
Ekstrak Teks dalam Format Teks Biasa melalui Java
OCR SDK Asprise untuk Java telah menyediakan kefungsian lengkap untuk mengekstrak teks daripada imej dalam format teks biasa. Perpustakaan membolehkan pengguna dengan mudah mendapatkan semula kandungan teks dokumen atau imej yang diimbas, dan menggunakannya untuk pemprosesan atau analisis selanjutnya. Untuk mencapai tugas mengekstrak teks biasa terlebih dahulu anda perlu memuatkan imej daripada fail, aliran input atau URL dan menggunakan pengecaman OCR pada imej yang dimuatkan menggunakan API. Gunakan fungsi yang sesuai untuk mendapatkan semula teks yang diiktiraf dalam format teks biasa. Berikut menunjukkan cara memuatkan imej, dan teks yang diiktiraf sebagai teks biasa, dan hasilnya dicetak ke konsol.
Muat Imej, & Teks Dikenali melalui Java API
import com.asprise.ocr.Ocr;
public class OCRTest {
public static void main(String[] args) throws Exception {
// Load image from file
Ocr ocr = new Ocr();
ocr.startEngine("eng", Ocr.SPEED_FASTEST);
String recognizedText = ocr.recognize(new File("image.png"), Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);
// Print the plain text output
System.out.println("Recognized Text: " + recognizedText);
ocr.stopEngine();
}
}
Lakukan Pelbagai Operasi OCR dalam Apl Java
Asprise OCR SDK untuk Java API membenarkan pembangun perisian menjalankan pelbagai operasi OCR (Pengecaman Aksara Optik) pada pelbagai jenis dokumen. Perpustakaan menyokong sepenuhnya pelbagai jenis operasi OCR, seperti Fail Imej OCR, Fail PDF OCR, Teks Tulisan Tangan OCR, Pelbagai Bahasa OCR, melakukan OCR pada sebahagian imej, melakukan OCR pada berbilang fail input dalam satu tangkapan, melaksanakan OCR pada halaman tertentu daripada fail TIFF yang ditentukan, Pemprosesan Kelompok OCR dan banyak lagi. Perpustakaan menyediakan alat yang berkuasa dan fleksibel untuk melaksanakan operasi OCR pada pelbagai jenis dokumen. Dengan sokongannya untuk berbilang bahasa, imej dan fail PDF, teks tulisan tangan dan pemprosesan kelompok, anda boleh mengekstrak teks dengan cepat dan tepat daripada dokumen anda.
Lakukan OCR pada Berbilang Fail melalui Pustaka Java
String s = ocr.recognize("test.png;test2.jpg", -1, 0, 0, 400, 200,
Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);
perform OCR on a PDF input file:
String s = ocr.recognize("test.pdf", -1, 100, 100, 400, 200,
Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);
Sokongan Berbilang Threading menggunakan Asprise OCR
Asprise OCR SDK untuk Java API telah menyertakan sokongan lengkap untuk multi-threading, yang membolehkan pembangun memproses berbilang tugas OCR secara serentak. Ciri ini membolehkan pembangun meningkatkan prestasi aplikasi OCR mereka dengan mengedarkan pemprosesan OCR merentas berbilang benang, yang boleh berjalan serentak pada berbilang teras atau pemproses. Sokongan berbilang benang sangat boleh disesuaikan, membolehkan pembangun memperhalusi bilangan benang dan enjin OCR agar sepadan dengan sumber yang tersedia dan keperluan pemprosesan. Sebahagian besarnya, Asprise OCR SDK untuk sokongan berbilang benang Java menyediakan pembangun alat yang berkuasa dan fleksibel untuk membina aplikasi OCR berprestasi tinggi yang boleh memproses volum teks yang besar dengan cepat dan cekap.
Menulis Kod Pengurusan benang rumit
OcrExecutorService oes =
new OcrExecutorService("eng", Ocr.SPEED_FASTEST, 4); // 4 threads
List> futures = oes.invokeAll(Arrays.asList(
new OcrExecutorService.OcrCallable(
new File[] {new File("test1.png")},
Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML),
new OcrExecutorService.OcrCallable(
new File[] {new File("test2.png")},
Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML)
);
System.out.println("Result of test1.png: " + futures.get(0).get());
System.out.println("Result of test2.png: " + futures.get(1).get());
oes.shutdown(); // stops all OCR engines and disposes all threads