Görüntülerden Metin Yüklemek ve Çıkarmak için Gelişmiş Ücretsiz Ruby Kitaplığı
Yazılım Geliştiricilerinin Görüntülerden Metin (taranmış görüntüler ve PDF dosyaları) Yüklemesine, Tanımasına ve Çıkarmasına olanak tanıyan Önde Gelen Açık Kaynak Ruby OCR API ve Görüntüden Metne Dönüştürücü
Optik Karakter Tanıma (OCR), bilgisayarların görüntülerden veya taranan belgelerden metinleri tanımasını ve ayıklamasını sağlayan güçlü bir teknolojidir. Basılı materyallerin dijitalleştirilmesinden veri giriş süreçlerinin otomatikleştirilmesine kadar çok sayıda uygulamaya sahiptir. Ruby programlama dilinde OCR için popüler kütüphanelerden biri Ruby-Tesseract-OCR'dir. Ruby-Tesseract-OCR, Tesseract OCR motoru için sarmalayıcı görevi gören bir Ruby taşıdır. Tesseract, Google tarafından geliştirilen bir Açık Kaynak OCR motorudur ve doğruluğu ve dil desteğiyle ünlüdür.
Ruby-Tesseract-OCR, temel OCR özelliklerinin ötesine geçer ve gelişmiş kullanım örnekleri için ek özellikler sunar. Örneğin, Yazılım geliştiricileri, OCR analizini belirli bir alanla sınırlamak için bir görüntü içinde bir ilgi bölgesi (ROI) belirleyebilir. Bu özellikle karmaşık belgelerle uğraşırken veya yalnızca belirli bir bölümden metin çıkarmanız gerektiğinde kullanışlıdır. Kitaplık, OCR yeteneklerini geliştirmek için mevcut bir görüntüyü yükleme, görüntülerden veya taranan belgelerden metin çıkarma, HOCR (HTML OCR) çıktısı alma ve çok daha fazlası gibi çeşitli ek özellikler sağlar.
Ruby-Tesseract-OCR cevheri, Tesseract motoruyla etkileşim kurmak için kullanımı kolay bir arayüz sağlayarak Ruby geliştiricilerinin OCR yeteneklerini projelerine zahmetsizce entegre etmelerine olanak tanır. İster faturalardan bilgi çıkarmaya, ister basılı malzemeleri dijitalleştirmeye, ister veri girişi görevlerini otomatikleştirmeye ihtiyacınız olsun, açık kaynak kitaplığı güvenilir ve etkili bir çözüm sunar. Hemen deneyin ve Ruby projelerinizde OCR'nin potansiyelini ortaya çıkarın.
Ruby-Tesseract-OCR'a Başlarken
Ruby-Tesseract-OCR'yi kurmanın önerilen yolu Rubygems'i kullanmaktır. Sorunsuz bir kurulum için lütfen aşağıdaki komutu kullanın.
Ruby-Tesseract-OCR'yi Rubygems aracılığıyla yükleyin
gem install tesseract-ocr
Derlenmiş paylaşılan kitaplığı Github deposundan indirebilirsiniz.
Ruby ile Görüntülerden ve Taranan Belgelerden Metin Çıkarma
Ruby-Tesseract-OCR, yazılım geliştiricilerin yalnızca birkaç satırlık Ruby koduyla çeşitli görüntü türlerinden metin yüklemesine ve bunlardan metin çıkarmasına olanak tanıyan çok güçlü bir açık kaynaklı kitaplıktır. Kitaplık görüntülerden, PDF'lerden veya taranmış belgelerden metin çıkarmayı kolaylaştırır. Tipik iş akışı, bir görüntünün yüklenmesini, OCR parametrelerinin yapılandırılmasını ve OCR motorunun metni tanıması için çağrılmasını içerir. Başarılı bir işlem için geliştiricilerin işlemek istedikleri görüntünün yolunu sağlamaları ve metni çıkarmak için text_for yöntemini çağırmaları gerekir. Son olarak sonuç konsola yazdırılacaktır. Kitaplık, OCR davranışını kontrol etmek için sayfa bölümlendirme modu, beyaz liste karakterleri ve daha fazlası gibi çeşitli F yapılandırma seçenekleri sunar. Aşağıdaki örnekler, yazılım geliştiricilerin Ruby uygulamaları içinde bir JPEG görüntüsünü nasıl yükleyebileceklerini ve bu görüntüden metni nasıl çıkarabileceklerini göstermektedir.
Ruby Komutlarını Kullanarak Görüntülerden Metin Nasıl Çıkarılır?
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
e.text_for('test/first.png').strip # => 'ABC'
Ruby Aracılığıyla Belirli Bir Görüntü Alanından Metin Çıkarma
Açık kaynak Ruby-Tesseract-OCR kitaplığı, temel OCR özelliklerinin ötesine geçer ve gelişmiş kullanım örnekleri için ek özellikler sunar. Örneğin kullanıcılar, OCR analizini belirli bir alanla sınırlamak için bir görüntü içinde bir ilgi bölgesi (ROI) belirtebilir. Bu özellikle karmaşık belgelerle uğraşırken veya kullanıcıların yalnızca belirli bir bölümden metin çıkarması gerektiğinde kullanışlıdır. Ayrıca kütüphane, yalnızca tanınan metni değil aynı zamanda metin öğelerinin düzeni ve koordinatları hakkındaki bilgileri de içeren HOCR (HTML OCR) çıktısının elde edilmesine yönelik yöntemler sağlar. HOCR çıktısı, daha ayrıntılı verilere ihtiyaç duyduğunuzda veya metin yapısı üzerinde daha fazla analiz yapmak istediğinizde faydalıdır.
Ruby Kütüphanesi aracılığıyla bir Görüntü üzerinde hOCR nasıl gerçekleştirilir?
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
puts e.hocr_for('test/first.png')