Perpustakaan Ruby Percuma Lanjutan untuk Memuatkan dan Mengekstrak Teks daripada Imej

API Ruby OCR Sumber Terbuka Terkemuka & Penukar Imej kepada Teks yang membolehkan Pembangun Perisian Memuatkan, Mengecam dan Mengekstrak Teks daripada Imej (imej yang diimbas & fail PDF)

Pengecaman Aksara Optik (OCR) ialah teknologi berkuasa yang membolehkan komputer mengecam dan mengekstrak teks daripada imej atau dokumen yang diimbas. Ia mempunyai banyak aplikasi, daripada mendigitalkan bahan bercetak kepada mengautomasikan proses kemasukan data. Dalam bahasa pengaturcaraan Ruby, satu perpustakaan popular untuk OCR ialah Ruby-Tesseract-OCR. Ruby-Tesseract-OCR ialah permata Ruby yang berfungsi sebagai pembungkus untuk enjin Tesseract OCR. Tesseract ialah enjin OCR Sumber Terbuka yang dibangunkan oleh Google dan terkenal dengan ketepatan serta sokongan bahasanya.

Ruby-Tesseract-OCR melangkaui keupayaan OCR asas dan menawarkan ciri tambahan untuk kes penggunaan lanjutan. Sebagai contoh, pembangun perisian boleh menentukan kawasan minat (ROI) dalam imej untuk mengehadkan analisis OCR kepada kawasan tertentu. Ini amat berguna apabila berurusan dengan dokumen yang kompleks atau apabila anda hanya perlu mengekstrak teks daripada bahagian tertentu. Perpustakaan menyediakan beberapa ciri tambahan untuk meningkatkan keupayaan OCR, seperti memuatkan imej sedia ada, mengekstrak teks daripada imej atau dokumen yang diimbas, mendapatkan output HOCR (HTML OCR) dan banyak lagi.

Permata Ruby-Tesseract-OCR menyediakan antara muka yang mudah digunakan untuk berinteraksi dengan enjin Tesseract, membolehkan pembangun Ruby menyepadukan keupayaan OCR ke dalam projek mereka dengan mudah. Sama ada anda perlu mengekstrak maklumat daripada invois, mendigitalkan bahan bercetak atau mengautomasikan tugasan kemasukan data, perpustakaan sumber terbuka menyediakan penyelesaian yang boleh dipercayai dan cekap. Cubalah dan buka kunci potensi OCR dalam projek Ruby anda hari ini.

Sekilas Pandang

Ikhtisar ciri Ruby-Tesseract-OCR.

Gambaran Keseluruhan Ciri

Lakukan OCR
Tambah Keupayaan OCR
Kecam teks Imej
Muat Imej melalui URL
Tukar PDF tp teks
Teks Font Dikenali
Cari PDF
Bahasa Lain
Buat apl OCR
Simpan ke penyemak imbas
Ekstrak Teks
Sokongan Berbilang Benang

Ruby-Tesseract-OCR

Ruby-Tesseract-OCR menyokong format fail OCR popular yang disenaraikan di bawah.

Reader

PNG, JPEG, BMP, TIFF, TGA, DICOM

Writer

PNG, JPEG, BMP, TIFF

Ruby-Tesseract-OCR

Kemerdekaan Platform

Ruby-Tesseract-OCR hanya memerlukan Ruby Runtime.

Ruby 5.1 dan ke atas.

Ruby-Tesseract-OCR

Bermula dengan Ruby-Tesseract-OCR

Cara yang disyorkan untuk memasang Ruby-Tesseract-OCR menggunakan Rubygems. Sila gunakan arahan berikut untuk pemasangan yang lancar.

Pasang Ruby-Tesseract-OCR melalui Rubygems

gem install tesseract-ocr

Anda boleh memuat turun perpustakaan kongsi yang disusun daripada repositori Github.

Ekstrak Teks daripada Imej & Dokumen yang Diimbas melalui Ruby

Ruby-Tesseract-OCR ialah perpustakaan sumber terbuka yang sangat berkuasa yang membolehkan pembangun perisian memuatkan dan mengekstrak teks daripada pelbagai jenis imej dengan hanya beberapa baris kod Ruby. Perpustakaan memudahkan untuk mengekstrak teks daripada imej, PDFS atau dokumen yang diimbas. Aliran kerja biasa melibatkan memuatkan imej, mengkonfigurasi parameter OCR dan menggunakan enjin OCR untuk mengecam teks. Untuk operasi yang berjaya, pembangun perlu menyediakan laluan ke imej yang ingin mereka proses dan memanggil kaedah text_for untuk mengekstrak teks. Akhirnya, hasilnya akan dicetak ke konsol. Pustaka menawarkan pelbagai pilihan Fconfiguration untuk mengawal tingkah laku OCR, seperti mod pembahagian halaman, aksara senarai putih dan banyak lagi. Contoh berikut menunjukkan cara pembangun perisian boleh memuatkan imej JPEG dan mengekstrak teks daripadanya di dalam aplikasi Ruby.

Bagaimana untuk Mengekstrak Teks daripada Imej menggunakan Perintah Ruby?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

e.text_for('test/first.png').strip # => 'ABC'

Ekstrak Teks daripada Kawasan Imej Tertentu melalui Ruby

Pustaka Ruby-Tesseract-OCR sumber terbuka melangkaui keupayaan OCR asas dan menawarkan ciri tambahan untuk kes penggunaan lanjutan. Sebagai contoh, pengguna boleh menentukan kawasan minat (ROI) dalam imej untuk mengehadkan analisis OCR kepada kawasan tertentu. Ini amat berguna apabila berurusan dengan dokumen yang kompleks atau apabila pengguna hanya perlu mengekstrak teks daripada bahagian tertentu. Selain itu, perpustakaan menyediakan kaedah untuk mendapatkan output HOCR (HTML OCR), yang merangkumi bukan sahaja teks yang diiktiraf tetapi juga maklumat tentang susun atur dan koordinat elemen teks. Output HOCR berguna apabila anda memerlukan lebih banyak data berbutir atau ingin melakukan analisis lanjut pada struktur teks.

Bagaimana untuk melaksanakan hOCR pada Imej melalui Perpustakaan Ruby?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

puts e.hocr_for('test/first.png')