Perpustakaan Ruby Sumber Terbuka untuk Menukar Imej kepada Teks Dalam Talian
Perpustakaan Pengecaman Aksara Optik (OCR) Ruby Percuma Membenarkan Pembangun Perisian Memuat, Membaca dan Menukar Imej, PDF atau dokumen Diimbas kepada Teks atau Dokumen Boleh Dicari
Teknologi Pengecaman Aksara Optik (OCR) telah membuat kemajuan yang ketara dalam beberapa tahun kebelakangan ini, menjadikannya lebih mudah untuk mengautomasikan pengekstrakan data daripada pelbagai sumber. Ia membolehkan automasi, meningkatkan kebolehcapaian data dan meningkatkan produktiviti dalam pelbagai domain. Salah satu alat yang berkuasa ialah perpustakaan OcrSpace Ruby, yang menyediakan pembangun penyelesaian yang mudah untuk menyepadukan keupayaan OCR ke dalam aplikasi Ruby mereka. Pustaka ini memudahkan proses mengekstrak teks daripada imej, dokumen yang diimbas dan fail PDF, menjadikannya pilihan terbaik untuk pembangun yang mencari penyelesaian OCR yang mudah.
Pustaka OcrSpace Ruby menawarkan antara muka yang mudah dan intuitif, menjadikannya mudah untuk menyepadukan keupayaan OCR ke dalam aplikasi Ruby. Terdapat beberapa ciri penting bahagian perpustakaan, seperti memuatkan pelbagai jenis imej, mengekstrak teks daripada imej, menukar dokumen yang diimbas kepada teks, mengekstrak teks daripada dokumen yang ditulis dalam pelbagai bahasa, mengecam teks daripada imej resolusi rendah, bekerja dengan kandungan tulisan tangan , mendapatkan semula koordinat teks yang diiktiraf, mengesan nombor halaman, mengenal pasti kawasan minat tertentu dan banyak lagi.
Pustaka OcrSpace Ruby ialah pembalut di sekeliling API Ocr.Space OCR, yang menawarkan pengekstrakan teks yang boleh dipercayai dan tepat daripada imej dan dokumen PDF. Dibina khusus untuk pembangun Ruby, perpustakaan ini memudahkan proses penyepaduan, membolehkan pengaturcara memasukkan fungsi OCR dengan cepat ke dalam aplikasi mereka tanpa berurusan dengan kerumitan API yang mendasari. Sama ada anda sedang membina sistem pengurusan dokumen, mengautomasikan pengekstrakan data atau meningkatkan kebolehaksesan, perpustakaan OcrSpace Ruby ialah alat yang tidak ternilai yang menyelaraskan proses OCR dan memperkasakan aplikasi anda dengan keupayaan pengekstrakan teks yang tepat.
Bermula dengan OcrSpace
Cara yang disyorkan untuk memasang OcrSpace adalah menggunakan Rubygems. Sila gunakan arahan berikut untuk pemasangan yang lancar.
Pasang OcrSpace melalui Rubygems
$ gem install ocr_space
Anda boleh memuat turun perpustakaan kongsi yang disusun daripada repositori Github.
Tukar Imej daripada URL kepada Teks melalui API Ruby
Pustaka OcrSpace sumber terbuka telah menyertakan beberapa ciri berkuasa untuk memuatkan pelbagai jenis imej dan menukarnya kepada teks dengan beberapa baris kod Ruby. Perpustakaan menyokong pelbagai pilihan OCR, termasuk mengekstrak teks daripada imej, dokumen yang diimbas dan fail PDF. Sama ada pembangun perisian perlu memproses invois, resit atau sebarang jenis dokumen lain, perpustakaan OcrSpace Ruby boleh mengendalikannya dengan cekap. Contoh berikut menunjukkan cara pembangun perisian boleh menukar imej kepada teks melalui URL menggunakan API Ruby.
Tukar Imej daripada URL melalui Ruby API
result = resource.convert url: "http://bit.ly/2ih9aXt"
puts result
=> #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]
result = resource.clean_convert url: "http://bit.ly/2ih9aXt"
puts result
=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES
Keupayaan OCR Lanjutan melalui API Ruby
Pustaka OcrSpace sumber terbuka telah menyertakan beberapa ciri yang sangat berguna dan canggih untuk mengendalikan operasi OCR dalam aplikasi Ruby. Ia boleh mengecam teks dengan tepat daripada imej beresolusi rendah, teks yang herot, dan juga kandungan tulisan tangan, memastikan hasil yang boleh dipercayai merentas pelbagai senario. Selain daripada pengekstrakan teks, perpustakaan juga membenarkan pembangun mengekstrak maklumat penting lain daripada dokumen. Ini termasuk mendapatkan semula koordinat teks yang diiktiraf, mengesan nombor halaman dan mengenal pasti bidang minat tertentu dalam dokumen.
Bagaimana untuk Mengekstrak Teks daripada Fail yang Dimuat Naik melalui Ruby API?
result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result #Raw result
=> #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}
result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result