Web Uygulamalarına OCR Eklemek ve Yönetmek için Açık Kaynak JavaScript API'si
JS Web Uygulamalarına Optik Karakter Tanıma (OCR) işlevi eklemek ve Basılı veya El Yazısı metinlerin Görüntülerini ücretsiz olarak Makine tarafından okunabilir Metne Dönüştürmek için Önde Gelen Ücretsiz JavaScript Kitaplığı.
Tesseract.js, yazılım geliştiricilerin optik karakter tanıma (OCR) işlevini web uygulamalarına minimum çaba ve maliyetle entegre etmelerine olanak tanıyan çok kullanışlı bir açık kaynaklı JavaScript kitaplığıdır. OCR, basılı veya el yazısı metinlerin görüntülerini makine tarafından okunabilir metne dönüştürme işlemidir. Tesseract.js, ilk olarak 1980'lerde Hewlett-Packard tarafından geliştirilen ve daha sonra Google tarafından bakımı yapılan popüler Tesseract OCR motorunun bir limanıdır. Tesseract.js 100'den fazla dili tanıyabildiği için web uygulamalarına OCR işlevselliği eklemek isteyen geliştiriciler için güçlü bir araç haline geliyor.
Tesseract.js'nin kullanımı çok kolaydır ve taranan belgelerden, makbuzlardan ve kartvizitlerden metin çıkarmak, veri girişi görevlerini otomatikleştirmek ve web uygulamaları içindeki arama işlevselliğini geliştirmek gibi çeşitli görevler için kullanılabilir. Tesseract.js'nin en önemli avantajlarından biri, giriş görselinin kalitesi veya çözünürlüğü düşük olsa bile metni tanıyabilmesidir. Kütüphane, OCR sonuçlarının doğruluğunu artırmak için makine öğrenimi algoritmalarını kullanır. Ayrıca sayfa düzeni analizi yapabilir ve bir görseldeki ilgi çekici bölgeleri tespit edebilir.
Tesseract.js, kullanım kolaylığı ve güçlü OCR yetenekleri nedeniyle popüler hale geliyor ve bir tarayıcıda veya NodeJS ile bir sunucuda sorunsuz bir şekilde çalıştırılabiliyor. Yazılım geliştiricilerin dil, sayfa segmentasyon modu ve beyaz liste karakterleri gibi OCR seçeneklerini yapılandırmasına olanak tanıyan basit bir API sağlar. Düşük kaliteli görüntülerdeki metinleri tanıyabilme yeteneği ve birden fazla dil desteği, onu geniş bir uygulama yelpazesi için değerli bir araç haline getiriyor ve web uygulamalarına OCR eklemek isteyen geliştiriciler için mükemmel bir seçim.
Tesseract.js'ye Başlarken
Tesseract.js'yi kurmanın önerilen yolu npm kullanmaktır. Sorunsuz bir kurulum için lütfen aşağıdaki komutu kullanın
Tesseract.jsvia npm'yi yükleyin
npm install tesseract.js
Ayrıca manuel olarak da kurabilirsiniz; En son sürüm dosyalarını doğrudan GitHub deposundan indirin.
JavaScript API aracılığıyla Görüntüyü Metne Dönüştürme
Açık kaynak JavaScript kitaplığı Tesseract.js, yazılım geliştiricilerin BMP, JPG, PNG, PBM, WebP ve daha pek çok çeşitli görüntü türüyle çalışmasını kolaylaştırır. Kitaplık, resimlerdeki, PDF'lerdeki ve taranan belgelerdeki metinlerin işlenmesini otomatikleştirmek için resimlerden metin çıkarmayı destekler. Aşağıdaki örnek, bir görüntünün nasıl yükleneceğini ve yalnızca birkaç satır kodla ondan metin çıkarılacağını gösterir. Dil argümanı, görüntülerin işlenmesinde kullanılacak eğitilmiş dil verilerini belirlemek için kullanılır. Yazılım geliştiricileri burada birden fazla dil kullanabilir.
JavaScript API kullanarak Görüntüyü Metne Nasıl Dönüştürürüz?
Tesseract.recognize(
image,language,
{
logger: m => console.log(m)
}
)
.catch (err => {
console.error(err);
})
.then(result => {
console.log(result);
})
}
JS API aracılığıyla Görüntü Bölgesini Okuyun ve Metni Çıkarın
Açık kaynak JavaScript kitaplığı, bir görüntünün içindeki belirli bir alanı okumak ve JavaScript uygulamaları içindeki verilerini yakalamak için çok kullanışlı özellikler içerir. API, görüntü alanının yakalanmasını destekler ve dahili güçlü OCR motorunu kullanarak bu bölgenin içindeki metni tanımaya çalışır. Aşağıdaki örnekler, yazılım geliştiricilerin görüntüye URL'yi nasıl sağlayabileceğini ve API'nin seçilen alandaki metni kolayca algılayıp tanıyabildiğini gösterir.
JS API Aracılığıyla Bir Görüntünün Seçili Bölgesindeki Metni Okuma ve Tanıma
const { createWorker } = require('tesseract.js');
const worker = await createWorker();
const rectangle = { left: 0, top: 0, width: 500, height: 250 };
(async () => {
await worker.loadLanguage('eng');
await worker.initialize('eng');
const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png', { rectangle });
console.log(text);
await worker.terminate();
})();