1. Produk
  2.   OCR
  3.   JavaScript
  4.   Tesseract.js
 
  

API JavaScript Sumber Terbuka untuk Menambah & Mengurus OCR pada Apl Web

Perpustakaan JavaScript Percuma Terkemuka untuk Menambahkan fungsi Pengecaman Aksara Optik (OCR) pada Apl Web JS & Mengubah Imej teks Bercetak atau Tulisan Tangan kepada Teks boleh dibaca Mesin secara percuma.

Tesseract.js ialah perpustakaan JavaScript sumber terbuka yang sangat berguna yang membolehkan pembangun perisian menyepadukan fungsi pengecaman aksara optik (OCR) dalam aplikasi web mereka dengan usaha dan kos yang minimum. OCR ialah proses menukar imej teks bercetak atau tulisan tangan kepada teks yang boleh dibaca mesin. Tesseract.js ialah pelabuhan enjin Tesseract OCR yang popular, yang pada asalnya dibangunkan oleh Hewlett-Packard pada tahun 1980-an dan kemudian diselenggara oleh Google. Tesseract.js boleh mengenali lebih 100 bahasa, menjadikannya alat yang berkuasa untuk pembangun yang ingin menambahkan fungsi OCR pada aplikasi web mereka.

Tesseract.js sangat mudah dikendalikan dan boleh digunakan untuk pelbagai tugas, seperti mengekstrak teks daripada dokumen yang diimbas, resit dan kad perniagaan, mengautomasikan tugasan kemasukan data serta mempertingkatkan fungsi carian dalam aplikasi web. Salah satu kelebihan utama Tesseract.js ialah keupayaannya untuk mengecam teks walaupun apabila imej input tidak berkualiti atau beresolusi. Perpustakaan menggunakan algoritma pembelajaran mesin untuk meningkatkan ketepatan keputusan OCR. Ia juga boleh melakukan analisis reka letak halaman dan mengesan kawasan yang menarik dalam imej.

Tesseract.js semakin popular kerana kemudahan penggunaannya serta keupayaan OCR yang berkuasa dan boleh dijalankan dengan lancar sama ada dalam penyemak imbas atau pada pelayan dengan NodeJS. Ia menyediakan API mudah yang membolehkan pembangun perisian mengkonfigurasi pilihan OCR seperti bahasa, mod pembahagian halaman dan aksara senarai putih. Keupayaannya untuk mengecam teks daripada imej berkualiti rendah dan sokongan untuk berbilang bahasa menjadikannya alat yang berharga untuk pelbagai aplikasi dan pilihan yang sangat baik untuk pembangun yang ingin menambahkan OCR pada aplikasi web mereka.

Previous Next

Bermula dengan Tesseract.js

Cara yang disyorkan untuk memasang Tesseract.js adalah menggunakan npm. Sila gunakan arahan berikut untuk pemasangan yang lancar

Pasang Tesseract.jsvia npm

 npm install tesseract.js

Anda juga boleh memasangnya secara manual; muat turun fail keluaran terkini terus daripada repositori GitHub.

Tukar Imej kepada Teks melalui API JavaScript

Pustaka JavaScript sumber terbuka Tesseract.js memudahkan pembangun perisian untuk Bekerja dengan pelbagai jenis imej seperti BMP, JPG, PNG, PBM, WebP dan banyak lagi. Perpustakaan menyokong pengekstrakan teks daripada imej untuk mengautomasikan pemprosesan teks pada imej, PDF dan dokumen yang diimbas. Contoh berikut menunjukkan cara memuatkan imej dan mengekstrak teks daripadanya dengan hanya beberapa baris kod. Hujah bahasa digunakan untuk menentukan data bahasa terlatih untuk digunakan dalam pemprosesan imej. Pembangun perisian boleh menggunakan berbilang bahasa di sini.

Bagaimana untuk Menukar Imej kepada Teks menggunakan API JavaScript?

Tesseract.recognize(
  image,language,
  { 
    logger: m => console.log(m) 
  }
)
.catch (err => {
  console.error(err);
})
.then(result => {
 console.log(result);
})
}

Baca Rantau Imej & Ekstrak Teks melalui API JS

Pustaka JavaScript sumber terbuka telah menyertakan ciri yang sangat berguna untuk membaca kawasan tertentu di dalam imej dan menangkap datanya di dalam aplikasi JavaScript. API menyokong menangkap kawasan imej dan cuba mengecam teks di dalam rantau ini menggunakan enjin OCR berkuasa dalaman. Contoh berikut menunjukkan cara pembangun perisian boleh menyediakan URL kepada imej dan API boleh mengesan dan mengecam teks dengan mudah dalam kawasan yang dipilih.

Baca dan Kenali Teks dalam Kawasan Terpilih bagi Imej melalui API JS

const { createWorker } = require('tesseract.js');

const worker = await createWorker();
const rectangle = { left: 0, top: 0, width: 500, height: 250 };

(async () => {
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png', { rectangle });
  console.log(text);
  await worker.terminate();
})();
 Melayu