API Node.js Percuma untuk Menambah Keupayaan OCR kepada Projek JS.
Perpustakaan OCR Node.js Sumber Terbuka yang Membolehkan Pengaturcara Mengenali & Mengekstrak Teks dari Pelbagai Format Fail, termasuk Imej (JPEG, PNG), PDF, dan Dokumen secara Percuma dalam Pelbagai Bahasa.
Apakah Node-Tesseract-OCR?
Dalam era digital masa kini, mengekstrak teks dari imej dan dokumen telah menjadi tugas penting dalam pelbagai industri, termasuk pengurusan dokumen, pemprosesan data, dan kecerdasan buatan. Teknologi Pengenalan Aksara Optik (OCR) telah memungkinkan penukaran dokumen imbas, imej, dan PDF menjadi format teks yang boleh disunting. Node-Tesseract-OCR ialah API sumber terbuka yang menggabungkan kuasa enjin Tesseract OCR untuk menyediakan cara yang lancar dan berkesan melaksanakan tugas OCR dalam aplikasi Node.js.
Node-Tesseract-OCR ialah pembungkus Node.js untuk enjin Tesseract OCR, membolehkan pemaju perisian menggunakan ciri pengenalan teks yang kuat daripada Tesseract dalam persekitaran Node.js. API ini diselenggara di repositori GitHub ini dan menawarkan pelbagai fungsi yang menjadikannya sesuai untuk pelbagai kes penggunaan, daripada pengekstrakan teks mudah hingga tugas pemprosesan dokumen yang lebih kompleks. Pemaju perisian boleh mengekstrak teks dari imej dan dokumen dalam pelbagai bahasa, menjadikannya alat serba boleh untuk pelbagai aplikasi.
API Node-Tesseract-OCR menyediakan keupayaan pemprosesan imej lanjutan, termasuk penapisan imej, penukuran saiz, dan pemotongan, untuk memastikan teks yang diekstrak tepat dan boleh dipercayai. Ia menyokong lebih daripada 100 bahasa, menjadikannya penyelesaian serba boleh untuk tugas OCR dalam persekitaran yang pelbagai. Pemaju perisian boleh mengekstrak teks dari imej, PDF, dan dokumen, serta mengembalikan teks yang diekstrak dalam pelbagai format, seperti JSON, XML, dan teks biasa. Ia direka untuk menjadi ringan, fleksibel, dan mudah digunakan, menjadikannya pilihan ideal bagi pemaju yang ingin menambah keupayaan OCR kepada projek mereka. Dengan keupayaan pemprosesan imej lanjutan, sokongan bahasa, dan mekanisme pengendalian ralat, ia merupakan pilihan tepat bagi pemaju yang ingin menambah keupayaan OCR kepada projek mereka.
Mula Menggunakan Node-Tesseract-OCR
Cara yang disyorkan untuk memasang Node-Tesseract-OCR adalah menggunakan npm. Sila gunakan perintah berikut untuk pemasangan yang lancar
Pasang Node-Tesseract-OCR melalui npm
npm install node-tesseract-ocr Anda juga boleh memasangnya secara manual; muat turun fail keluaran terkini secara langsung dari GitHub repository.
Ekstrak Teks dari Imej dalam API Node.js
Perpustakaan sumber terbuka Node-Tesseract-OCR memudahkan pemaju perisian mencipta aplikasi yang secara automatik mengekstrak teks dari imej dalam aplikasi Node.js. Ia menyokong pengekstrakan teks dari dokumen imbas, PDF, foto kamera atau foto resit. Ini boleh berguna untuk mencipta arkib boleh dicari, mengautomasi kemasukan data, atau memproses sejumlah besar dokumen dalam sektor seperti kewangan dan penjagaan kesihatan. Berikut ialah contoh mudah yang menunjukkan cara mengekstrak teks secara programatik daripada imej dalam aplikasi Node.js.
Bagaimana untuk Mengekstrak Teks dari Imej dalam Persekitaran Node.js?
const tesseract = require("node-tesseract-ocr");
tesseract.recognize("path/to/image.jpg")
.then(text => {
console.log("Recognized Text:", text);
})
.catch(error => {
console.error("Error:", error.message);
});
Pra-pemprosesan Imej yang Lebih Baik dalam Node.js
Pra-pemprosesan imej sebelum menggunakan OCR dapat meningkatkan ketepatan pengenalan teks dengan ketara. Perpustakaan sumber terbuka Node-Tesseract-OCR membenarkan teknik pra-pemprosesan asas, seperti penukaran saiz, binarisasi, dan pembetulan kecenderungan. Langkah pra-pemprosesan ini boleh dilaksanakan menggunakan perpustakaan Node.js tambahan seperti sharp atau jimp bersama Node-Tesseract-OCR. Contoh berikut menunjukkan bagaimana pemaju perisian menggunakan langkah pra-pemprosesan untuk meningkatkan pengenalan, terutama pada imej berkualiti rendah.
Bagaimana untuk Menerapkan Langkah Pra-pemprosesan untuk Meningkatkan Pengenalan melalui API Node.js?
const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");
sharp("path/to/input.jpg")
.resize(800, 600) // Resize the image
.greyscale() // Convert to greyscale
.toBuffer()
.then(data => {
return tesseract.recognize(data, { lang: "eng" });
})
.then(text => {
console.log("Preprocessed Image Text:", text);
})
.catch(error => {
console.error("Error:", error.message);
});
Teks yang Dikenali dalam Pelbagai Bahasa
Salah satu ciri menonjol Node-Tesseract-OCR ialah sokongan pelbagai bahasa yang luas. Perpustakaan Tesseract OCR menyokong lebih daripada 100 bahasa, menjadikannya pilihan ideal untuk aplikasi yang perlu memproses dokumen dalam pelbagai bahasa. Pemaju perisian boleh menentukan bahasa yang ingin digunakan oleh Tesseract, meningkatkan ketepatan pengenalan untuk teks bukan Inggeris. Berikut ialah contoh yang menunjukkan bagaimana pemaju perisian dapat mengenali teks dalam Bahasa Perancis di dalam aplikasi Node.js?
Bagaimana untuk Mengenali Teks dari Imej dalam Bahasa Perancis melalui API JavaScript?
const config = {
lang: "fra", // French language support
oem: 1,
psm: 3
};
tesseract.recognize("path/to/french-text-image.jpg", config)
.then(text => {
console.log("Recognized Text in French:", text);
})
.catch(error => {
console.error("Error:", error.message);
});