Free Node.js API to Add OCR Capabilities to JS Projects.
Open Source Node.js OCR Library That Allows Programmers to Recognize & Extract Text from Various File Formats, including Images(JPEG, PNG), PDFs, and Documents for Free in Multi Languages.
Apa itu Node-Tesseract-OCR?
Pada era digital saat ini, mengekstrak teks dari gambar dan dokumen telah menjadi tugas penting di berbagai industri, termasuk manajemen dokumen, pemrosesan data, dan kecerdasan buatan. Teknologi Optical Character Recognition (OCR) memungkinkan konversi dokumen yang dipindai, gambar, dan PDF menjadi format teks yang dapat diedit. Node-Tesseract-OCR adalah API sumber terbuka yang menggabungkan kekuatan mesin Tesseract OCR untuk menyediakan cara yang mulus dan efisien melakukan tugas OCR dalam aplikasi Node.js.
Node-Tesseract-OCR adalah pembungkus Node.js untuk mesin Tesseract OCR, memungkinkan pengembang perangkat lunak memanfaatkan fitur pengenalan teks kuat Tesseract dalam lingkungan Node.js. API ini dipelihara di repositori GitHub ini dan menawarkan beragam fungsionalitas yang membuatnya cocok untuk berbagai kasus penggunaan, mulai dari ekstraksi teks sederhana hingga tugas pemrosesan dokumen yang lebih kompleks. Pengembang dapat mengekstrak teks dari gambar dan dokumen dalam banyak bahasa, menjadikannya alat serbaguna untuk berbagai aplikasi.
API Node-Tesseract-OCR menyediakan kemampuan pemrosesan gambar lanjutan, termasuk penyaringan gambar, pengubahan ukuran, dan pemotongan, untuk memastikan teks yang diekstrak akurat dan dapat diandalkan. Ia mendukung lebih dari 100 bahasa, menjadikannya solusi serbaguna untuk tugas OCR di lingkungan yang beragam. Pengembang dapat mengekstrak teks dari gambar, PDF, dan dokumen, serta mengembalikan teks yang diekstrak dalam berbagai format, seperti JSON, XML, dan teks biasa. Dirancang ringan, fleksibel, dan mudah digunakan, sehingga menjadi pilihan ideal bagi pengembang yang ingin menambahkan kemampuan OCR ke proyek mereka. Dengan kemampuan pemrosesan gambar lanjutan, dukungan bahasa, dan mekanisme penanganan kesalahan, ia menjadi pilihan tepat bagi pengembang yang ingin menambahkan kemampuan OCR ke proyek mereka.
Memulai dengan Node-Tesseract-OCR
Cara yang disarankan untuk menginstal Node-Tesseract-OCR adalah menggunakan npm. Silakan gunakan perintah berikut untuk instalasi yang lancar
Instal Node-Tesseract-OCR via npm
npm install node-tesseract-ocr Anda juga dapat menginstalnya secara manual; unduh file rilis terbaru langsung dari GitHub repository.
Ekstraksi Teks dari Gambar dalam API Node.js
Perpustakaan Node-Tesseract-OCR sumber terbuka memudahkan pengembang perangkat lunak membuat aplikasi yang secara otomatis mengekstrak teks dari gambar di dalam aplikasi Node.js. Ia mendukung ekstraksi teks dari dokumen yang dipindai, PDF, foto kamera, atau foto kwitansi. Hal ini dapat berguna untuk membuat arsip yang dapat dicari, mengotomatisasi entri data, atau memproses volume dokumen yang besar di sektor seperti keuangan dan perawatan kesehatan. Berikut contoh sederhana yang menunjukkan cara mengekstrak teks dari gambar secara programatik di dalam aplikasi Node.js.
Cara Mengekstrak Teks dari Gambar dalam Lingkungan Node.js?
const tesseract = require("node-tesseract-ocr");
tesseract.recognize("path/to/image.jpg")
.then(text => {
console.log("Recognized Text:", text);
})
.catch(error => {
console.error("Error:", error.message);
});
Pra-pemrosesan Gambar yang Lebih Baik dalam Node.js
Pra-pemrosesan gambar sebelum menerapkan OCR dapat secara signifikan meningkatkan akurasi pengenalan teks. Perpustakaan Node-Tesseract-OCR sumber terbuka memungkinkan teknik pra-pemrosesan dasar, seperti mengubah ukuran, binarisasi, dan deskewing. Langkah-langkah pra-pemrosesan ini dapat diimplementasikan menggunakan perpustakaan Node.js tambahan seperti sharp atau jimp bersamaan dengan Node-Tesseract-OCR. Contoh berikut menunjukkan bagaimana pengembang perangkat lunak menggunakan langkah pra-pemrosesan untuk meningkatkan pengenalan, terutama pada gambar ber kualitas rendah.
Cara Menerapkan Langkah Pra-pemrosesan untuk Meningkatkan Pengakuan melalui API Node.js?
const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");
sharp("path/to/input.jpg")
.resize(800, 600) // Resize the image
.greyscale() // Convert to greyscale
.toBuffer()
.then(data => {
return tesseract.recognize(data, { lang: "eng" });
})
.then(text => {
console.log("Preprocessed Image Text:", text);
})
.catch(error => {
console.error("Error:", error.message);
});
Teks yang Diakui dalam Multi-Bahasa
Salah satu fitur menonjol Node-Tesseract-OCR adalah dukungan multi-bahasa yang luas. Perpustakaan Tesseract OCR mendukung lebih dari 100 bahasa, menjadikannya pilihan ideal untuk aplikasi yang perlu memproses dokumen dalam berbagai bahasa. Pengembang dapat menentukan bahasa yang ingin digunakan Tesseract, meningkatkan akurasi pengenalan untuk teks non-Inggris. Berikut contoh yang menunjukkan bagaimana pengembang dapat mengenali teks dalam bahasa Prancis di dalam aplikasi Node.js?
Cara Mengenali Teks dari Gambar dalam Bahasa Prancis via API JavaScript?
const config = {
lang: "fra", // French language support
oem: 1,
psm: 3
};
tesseract.recognize("path/to/french-text-image.jpg", config)
.then(text => {
console.log("Recognized Text in French:", text);
})
.catch(error => {
console.error("Error:", error.message);
});