1. Ürün:% s
  2.   OCR
  3.   Node.js
  4.   Node-Tesseract-OCR
 
  

JS Projelerine OCR Yeteneği Eklemek İçin Ücretsiz Node.js API.

Açık Kaynak Node.js OCR Kütüphanesi, Programcıların Görüntüler (JPEG, PNG), PDF'ler ve Belgeler dahil çeşitli dosya formatlarından metin tanımasını ve çıkarmasını çoklu dillerde ücretsiz olarak sağlar.

Node-Tesseract-OCR Nedir?

Günümüz dijital çağında, görüntülerden ve belgelerden metin çıkarmak, belge yönetimi, veri işleme ve yapay zeka gibi çeşitli sektörlerde kritik bir görev haline gelmiştir. Optik Karakter Tanıma (OCR) teknolojisi, taranmış belgeleri, görüntüleri ve PDF'leri düzenlenebilir metin formatlarına dönüştürmeyi mümkün kılmıştır. Node-Tesseract-OCR, Tesseract OCR motorunun gücünü birleştiren açık kaynaklı bir API olup, Node.js uygulamalarında OCR görevlerini sorunsuz ve verimli bir şekilde gerçekleştirmeyi sağlar.

Node-Tesseract-OCR, Tesseract OCR motoru için bir Node.js sarmalayıcısıdır ve yazılım geliştiricilerin Tesseract'ın güçlü metin tanıma özelliklerini bir Node.js ortamında kullanmalarını sağlar. API, bu GitHub deposunda sürdürülmekte ve basit metin çıkarımından daha karmaşık belge işleme görevlerine kadar çeşitli kullanım senaryolarına uygun bir dizi işlevsellik sunar. Yazılım geliştiriciler, görüntülerden ve belgelerden çoklu dillerde metin çıkarabilir, bu da onu çeşitli uygulamalar için çok yönlü bir araç yapar.

Node-Tesseract-OCR API, çıkarılan metnin doğru ve güvenilir olmasını sağlamak için görüntü filtreleme, yeniden boyutlandırma ve kırpma gibi gelişmiş görüntü işleme yetenekleri sunar. 100'den fazla dili destekleyerek çeşitli ortamlar için çok yönlü bir OCR çözümü sağlar. Yazılım geliştiriciler, görüntülerden, PDF'lerden ve belgelerden metin çıkarabilir ve çıkarılan metni JSON, XML ve düz metin gibi çeşitli formatlarda geri döndürebilir. Hafif, esnek ve kullanımı kolay olacak şekilde tasarlanmıştır; bu da projelerine OCR yetenekleri eklemek isteyen geliştiriciler için ideal bir seçimdir. Gelişmiş görüntü işleme yetenekleri, dil desteği ve hata yönetimi mekanizmalarıyla, projelerine OCR yetenekleri eklemek isteyen geliştiriciler için ideal bir tercihtir.

Previous Next

Node-Tesseract-OCR ile Başlarken

Node-Tesseract-OCR'yi kurmanın önerilen yolu npm kullanmaktır. Sorunsuz bir kurulum için lütfen aşağıdaki komutu kullanın

Install Node-Tesseract-OCR via npm

npm install node-tesseract-ocr 

Manuel olarak da kurabilirsiniz; en son sürüm dosyalarını doğrudan GitHub deposundan indirin.

Node.js API'de Görüntülerden Metin Çıkarma

Açık kaynaklı Node-Tesseract-OCR kütüphanesi, yazılım geliştiricilerin Node.js uygulamaları içinde görüntülerden otomatik olarak metin çıkaran uygulamalar oluşturmasını kolaylaştırır. Tarama belgeleri, PDF'ler, kamera fotoğrafları veya makbuz fotoğraflarından metin çıkarımını destekler. Bu, aranabilir arşivler oluşturmak, veri girişini otomatikleştirmek veya finans ve sağlık gibi sektörlerde büyük miktarda belge işlemek için faydalı olabilir. İşte Node.js uygulamaları içinde görüntülerden programlı olarak metin çıkarımını gösteren basit bir örnek.

How to Extract Text from Images inside Node.js Environment?

const tesseract = require("node-tesseract-ocr");

tesseract.recognize("path/to/image.jpg")
  .then(text => {
    console.log("Recognized Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Node.js içinde Daha İyi Görüntü Ön İşleme

OCR uygulamadan önce görüntüleri ön işleme yapmak, metin tanıma doğruluğunu önemli ölçüde artırabilir. Açık kaynaklı Node-Tesseract-OCR kütüphanesi, yeniden boyutlandırma, ikilileştirme ve eğrilik giderme gibi temel ön işleme tekniklerine izin verir. Bu ön işleme adımları, Node-Tesseract-OCR ile birlikte sharp veya jimp gibi ek Node.js kütüphaneleri kullanılarak uygulanabilir. Aşağıdaki örnek, yazılım geliştiricilerin özellikle düşük kaliteli görüntülerde tanıma performansını artırmak için ön işleme adımlarını nasıl kullandığını gösterir.

How to Apply Preprocessing Steps to Improve Recognition via Node.js API?

const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");

sharp("path/to/input.jpg")
  .resize(800, 600) // Resize the image
  .greyscale() // Convert to greyscale
  .toBuffer()
  .then(data => {
    return tesseract.recognize(data, { lang: "eng" });
  })
  .then(text => {
    console.log("Preprocessed Image Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Çok Dilli Tanınan Metin

Node-Tesseract-OCR'nin öne çıkan özelliklerinden biri kapsamlı çoklu dil desteğidir. Tesseract OCR kütüphanesi 100'den fazla dili destekler ve çeşitli dillerde belge işlemek zorunda olan uygulamalar için ideal bir seçimdir. Yazılım geliştiriciler, Tesseract'in kullanmasını istedikleri dili(leri) belirleyebilir, bu da İngilizce dışı metinlerin tanıma doğruluğunu artırır. İşte yazılım geliştiricilerin Node.js uygulamaları içinde Fransızca metin tanımasını gösteren bir örnek.

How to Recognized Text from Image in French via JavaScript API?

const config = {
  lang: "fra", // French language support
  oem: 1,
  psm: 3
};

tesseract.recognize("path/to/french-text-image.jpg", config)
  .then(text => {
    console.log("Recognized Text in French:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

 Türkçe