Metin ve Görüntüleri İşlemek İçin OCR için Açık Kaynak .NET API'si
Metin içeren görüntüleri (taranmış görüntüler ve PDF dosyaları) makine tarafından okunabilir metne dönüştürmek için kullanılan Açık Kaynak .NET Optik Karakter Tanıma (OCR) API'si.
Tesseract, yazılım geliştiricilerin metin içeren çeşitli görüntü türlerini Python uygulamaları içinde makine tarafından okunabilen metne dönüştürmesine olanak tanıyan çok güçlü bir açık kaynaklı optik karakter tanıma (OCR) motorudur. Açık kaynak teknolojisi, yazılım geliştiricilerin uygulamalarının içindeki güçlü araçlara ve kitaplıklara erişmelerini ve bunları entegre etmelerini kolaylaştırarak uygulamalarını oluşturma biçiminde devrim yarattı. Tesseract-ocr için bir .NET sarmalayıcıdır ve belge tarama ve veri ayıklamadan otomatik görüntü tanıma ve çeviriye kadar çok çeşitli uygulamalarda kullanılabilir.
Tesseract ilk olarak 1980'lerde Hewlett-Packard tarafından geliştirildi ve daha sonra 2005 yılında açık kaynaklı bir proje olarak piyasaya sürüldü. O tarihten bu yana Unicode (UTF) desteğiyle dünyada en yaygın kullanılan OCR motorlarından biri haline geldi. -8), 100'den fazla dil ve çok çeşitli görüntü formatlarını işleme yeteneği. API'nin belge tarama, belge dijitalleştirme, belgeleri aranabilir hale getirme, makine tarafından okunabilir belgeler oluşturma, OCR performansını optimize etme ve çok daha fazlası gibi çeşitli özellikleri vardır.
Tesseract'ın kullanımı çok kolaydır ve JPEG, BMP, PSD, PNG, TIFF ve çok daha fazlası gibi çok çeşitli görüntü formatlarındaki dijital görüntüler içindeki metni tanıyacak şekilde tasarlanmıştır. Kitaplık, farklı görüntü ve metin türleri için OCR performansını optimize etmek amacıyla kullanılabilecek çok çeşitli seçeneklerle son derece özelleştirilebilir. İster belge tarama ve dijitalleştirme, veri çıkarma veya görüntü tanıma ve çeviri üzerinde çalışıyor olun, Tesseract hedeflerinize hızlı ve kolay bir şekilde ulaşmanıza yardımcı olabilecek güçlü ve güvenilir bir çözüm sunar.
Tesseract'a Başlarken
Tesseract'ı kurmanın önerilen yolu NuGet kullanmaktır. Sorunsuz bir kurulum için lütfen aşağıdaki komutu kullanın.
Tesseract'ı NuGet aracılığıyla yükleyin
Install-Package Tesseract
Tesseract'ı GitHub aracılığıyla yükleyin
git clone https://github.com/charlesw/tesseract.git
C# aracılığıyla bir Görüntüden Temel Metni Çıkarma
Açık kaynak C# kitaplığı Tesseract, yazılım geliştiricilerin kendi .NET uygulamalarının içindeki bir görüntüden metin çıkarmasına olanak tanır. Kitaplık, yazılım geliştiricilerin taranan belge veya görüntülerin metin içeriğini kolayca almasını ve daha ileri işlemler veya analizler için kullanmasını kolaylaştırır. Görevi gerçekleştirmek için öncelikle geliştiricilerin Tesseract ad alanını kod dosyanıza aktarmaları ve Tesseract motorunun bir örneğini oluşturmaları gerekir. Aşağıdaki örnek, temel metnin görüntüden nasıl çıkarılacağını ve konsola nasıl çıkarılacağını gösterir.
C# API aracılığıyla Görüntüden Temel Metin Nasıl Çıkarılır?
using Tesseract;
using System.Drawing;
namespace MyNamespace
{
class Program
{
static void Main(string[] args)
{
var engine = new TesseractEngine("./tessdata", "eng", EngineMode.Default);
var image = new Bitmap(@"C:\path\to\your\image.jpg");
var page = engine.Process(image);
var text = page.GetText();
image.Dispose();
page.Dispose();
engine.Dispose();
Console.WriteLine(text);
}
}
}
C# .NET aracılığıyla Görüntüyü Aranabilir PDF'ye Dönüştürme
Açık kaynak C# kitaplığı Tesseract, C# kodunu kullanarak görüntüleri aranabilir PDF belgelerine dönüştürmek için bazı yararlı özellikler içerir. Kitaplık ayrıca düz metin, hOCR (HTML), PDF, görünmez metin içeren PDF, TSV, ALTO ve çok daha fazlası gibi çeşitli çıktı formatları için destek içerir. Daha iyi OCR sonuçları elde etmek için geliştiricinin Tesseract'a sağlayacakları görüntülerin kalitesini artırması gerektiğini lütfen unutmayın. Aşağıdaki örnek, görüntüden tanınan metni içeren aranabilir bir PDF belgesinin nasıl oluşturulacağını gösterir.
C# .NET kullanarak Görüntüyü Aranabilir PDF'ye Dönüştürme
using (var engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.Default))
{
using (var img = Pix.LoadFromFile(testImagePath))
{
using (var page = engine.Process(img))
{
var text = page.GetText();
Console.WriteLine("Mean confidence: {0}", page.GetMeanConfidence());
Console.WriteLine("Text (GetText): \r\n{0}", text);
Console.WriteLine("Text (iterator):");
}
}
}
FORMAT_PLAINTEXT);