Görüntülerden Metin Yüklemek ve Çıkarmak için Gelişmiş Ücretsiz Ruby Kitaplığı

Yazılım Geliştiricilerinin Görüntülerden Metin (taranmış görüntüler ve PDF dosyaları) Yüklemesine, Tanımasına ve Çıkarmasına olanak tanıyan Önde Gelen Açık Kaynak Ruby OCR API ve Görüntüden Metne Dönüştürücü

Optik Karakter Tanıma (OCR), bilgisayarların görüntülerden veya taranan belgelerden metinleri tanımasını ve ayıklamasını sağlayan güçlü bir teknolojidir. Basılı materyallerin dijitalleştirilmesinden veri giriş süreçlerinin otomatikleştirilmesine kadar çok sayıda uygulamaya sahiptir. Ruby programlama dilinde OCR için popüler kütüphanelerden biri Ruby-Tesseract-OCR'dir. Ruby-Tesseract-OCR, Tesseract OCR motoru için sarmalayıcı görevi gören bir Ruby taşıdır. Tesseract, Google tarafından geliştirilen bir Açık Kaynak OCR motorudur ve doğruluğu ve dil desteğiyle ünlüdür.

Ruby-Tesseract-OCR, temel OCR özelliklerinin ötesine geçer ve gelişmiş kullanım örnekleri için ek özellikler sunar. Örneğin, Yazılım geliştiricileri, OCR analizini belirli bir alanla sınırlamak için bir görüntü içinde bir ilgi bölgesi (ROI) belirleyebilir. Bu özellikle karmaşık belgelerle uğraşırken veya yalnızca belirli bir bölümden metin çıkarmanız gerektiğinde kullanışlıdır. Kitaplık, OCR yeteneklerini geliştirmek için mevcut bir görüntüyü yükleme, görüntülerden veya taranan belgelerden metin çıkarma, HOCR (HTML OCR) çıktısı alma ve çok daha fazlası gibi çeşitli ek özellikler sağlar.

Ruby-Tesseract-OCR cevheri, Tesseract motoruyla etkileşim kurmak için kullanımı kolay bir arayüz sağlayarak Ruby geliştiricilerinin OCR yeteneklerini projelerine zahmetsizce entegre etmelerine olanak tanır. İster faturalardan bilgi çıkarmaya, ister basılı malzemeleri dijitalleştirmeye, ister veri girişi görevlerini otomatikleştirmeye ihtiyacınız olsun, açık kaynak kitaplığı güvenilir ve etkili bir çözüm sunar. Hemen deneyin ve Ruby projelerinizde OCR'nin potansiyelini ortaya çıkarın.

Bir Bakışta

Ruby-Tesseract-OCR özelliklerine genel bakış.

Özelliklere genel bakış

OCR gerçekleştirin
OCR Yetenekleri Ekleme
Resim metnini tanıma
Resimleri URL yoluyla yükleyin
PDF tp metnini dönüştürün
Tanınan Yazı Tipi metni
PDF'de ara
Diğer Diller
OCR uygulamaları oluşturma
Tarayıcıya kaydet
Metni Çıkart
Çoklu İş Parçacığı Desteği

Ruby-Tesseract-OCR

Ruby-Tesseract-OCR, aşağıda listelenen popüler OCR dosya formatlarını destekler.

Okuyucu

PNG, JPEG, BMP, TIFF, TGA, DICOM

yazar

PNG, JPEG, BMP, TIFF

Ruby-Tesseract-OCR

Platform Bağımsızlığı

Ruby-Tesseract-OCR yalnızca Ruby Çalışma Zamanı gerektirir.

Ruby 5.1 ve üzeri.

Ruby-Tesseract-OCR

Ruby-Tesseract-OCR'a Başlarken

Ruby-Tesseract-OCR'yi kurmanın önerilen yolu Rubygems'i kullanmaktır. Sorunsuz bir kurulum için lütfen aşağıdaki komutu kullanın.

Ruby-Tesseract-OCR'yi Rubygems aracılığıyla yükleyin

gem install tesseract-ocr

Derlenmiş paylaşılan kitaplığı Github deposundan indirebilirsiniz.

Ruby ile Görüntülerden ve Taranan Belgelerden Metin Çıkarma

Ruby-Tesseract-OCR, yazılım geliştiricilerin yalnızca birkaç satırlık Ruby koduyla çeşitli görüntü türlerinden metin yüklemesine ve bunlardan metin çıkarmasına olanak tanıyan çok güçlü bir açık kaynaklı kitaplıktır. Kitaplık görüntülerden, PDF'lerden veya taranmış belgelerden metin çıkarmayı kolaylaştırır. Tipik iş akışı, bir görüntünün yüklenmesini, OCR parametrelerinin yapılandırılmasını ve OCR motorunun metni tanıması için çağrılmasını içerir. Başarılı bir işlem için geliştiricilerin işlemek istedikleri görüntünün yolunu sağlamaları ve metni çıkarmak için text_for yöntemini çağırmaları gerekir. Son olarak sonuç konsola yazdırılacaktır. Kitaplık, OCR davranışını kontrol etmek için sayfa bölümlendirme modu, beyaz liste karakterleri ve daha fazlası gibi çeşitli F yapılandırma seçenekleri sunar. Aşağıdaki örnekler, yazılım geliştiricilerin Ruby uygulamaları içinde bir JPEG görüntüsünü nasıl yükleyebileceklerini ve bu görüntüden metni nasıl çıkarabileceklerini göstermektedir.

Ruby Komutlarını Kullanarak Görüntülerden Metin Nasıl Çıkarılır?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

e.text_for('test/first.png').strip # => 'ABC'

Ruby Aracılığıyla Belirli Bir Görüntü Alanından Metin Çıkarma

Açık kaynak Ruby-Tesseract-OCR kitaplığı, temel OCR özelliklerinin ötesine geçer ve gelişmiş kullanım örnekleri için ek özellikler sunar. Örneğin kullanıcılar, OCR analizini belirli bir alanla sınırlamak için bir görüntü içinde bir ilgi bölgesi (ROI) belirtebilir. Bu özellikle karmaşık belgelerle uğraşırken veya kullanıcıların yalnızca belirli bir bölümden metin çıkarması gerektiğinde kullanışlıdır. Ayrıca kütüphane, yalnızca tanınan metni değil aynı zamanda metin öğelerinin düzeni ve koordinatları hakkındaki bilgileri de içeren HOCR (HTML OCR) çıktısının elde edilmesine yönelik yöntemler sağlar. HOCR çıktısı, daha ayrıntılı verilere ihtiyaç duyduğunuzda veya metin yapısı üzerinde daha fazla analiz yapmak istediğinizde faydalıdır.

Ruby Kütüphanesi aracılığıyla bir Görüntü üzerinde hOCR nasıl gerçekleştirilir?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

puts e.hocr_for('test/first.png')