Nyílt forráskódú .NET API az OCR-hez szövegek és képek feldolgozásához
Nyílt forráskódú .NET Optical Character Recognition (OCR) API, amellyel szöveget tartalmazó képeket (beolvasott képeket és PDF-fájlokat) gépileg olvasható szöveggé alakítanak át.
A Tesseract egy nagyon hatékony, nyílt forráskódú optikai karakterfelismerő (OCR) motor, amely lehetővé teszi a szoftverfejlesztők számára, hogy különféle típusú, szöveget tartalmazó képeket gépileg olvasható szöveggé alakítsanak át Python-alkalmazásokon belül. A nyílt forráskódú technológia forradalmasította a szoftverfejlesztők alkalmazásaik elkészítésének módját azáltal, hogy megkönnyítette számukra a hatékony eszközök és könyvtárak elérését és integrálását alkalmazásaikba. Ez egy .NET-burkoló a tesseract-ocr számára, és számos alkalmazásban használható, a dokumentumok beolvasásától és adatkinyerésétől az automatikus képfelismerésig és -fordításig.
A Tesseract-et eredetileg az 1980-as években fejlesztette ki a Hewlett-Packard, majd 2005-ben nyílt forráskódú projektként adták ki. Azóta a világ egyik legszélesebb körben használt OCR motorjává vált az Unicode (UTF) támogatásával. -8), több mint 100 nyelv, valamint a képformátumok széles skálájának feldolgozásának képessége. Az API-nak számos olyan funkciója van, mint például a dokumentumok szkennelése, a dokumentumok digitalizálása, a dokumentumok kereshetővé tétele, a géppel olvasható dokumentumok létrehozása, az OCR teljesítményének optimalizálása és még sok más.
A Tesseract nagyon könnyen kezelhető, és úgy tervezték, hogy felismerje a szöveget a digitális képeken belül számos képformátumban, például JPEG, BMP, PSD, PNG, TIFF és sok más formátumban. A könyvtár nagymértékben testreszabható, és számos opcióval optimalizálható az OCR teljesítménye különböző típusú képekhez és szövegekhez. Függetlenül attól, hogy dokumentumok szkennelésével és digitalizálásával, adatkinyeréssel vagy képfelismeréssel és fordítással foglalkozik, a Tesseract hatékony és megbízható megoldást kínál, amellyel gyorsan és egyszerűen elérheti céljait.
Kezdő lépések a Tesseracttel
A Tesseract telepítésének javasolt módja a NuGet használata. Kérjük, használja a következő parancsot a zökkenőmentes telepítés érdekében.
Tesseract telepítése NuGet segítségével
Install-Package Tesseract
Tesseract telepítése GitHubon keresztül
git clone https://github.com/charlesw/tesseract.git
Alapszöveg kinyerése egy képből C#-on keresztül
A Tesseract nyílt forráskódú C# könyvtár lehetővé teszi a szoftverfejlesztők számára, hogy szöveget vonjanak ki egy képből saját .NET-alkalmazásaikon belül. A könyvtár segítségével a szoftverfejlesztők könnyen visszakereshetik a beolvasott dokumentumok vagy képek szöveges tartalmát, és felhasználhatják azt további feldolgozásra vagy elemzésre. A feladat végrehajtásához a fejlesztőknek először importálniuk kell a Tesseract névteret a kódfájlba, és létre kell hozniuk a Tesseract motor egy példányát. A következő példa bemutatja, hogyan lehet kivonni az alapszöveget a képből, és kiadni a konzolra.
Hogyan lehet kinyerni az alapszöveget a képből C# API-n keresztül?
using Tesseract;
using System.Drawing;
namespace MyNamespace
{
class Program
{
static void Main(string[] args)
{
var engine = new TesseractEngine("./tessdata", "eng", EngineMode.Default);
var image = new Bitmap(@"C:\path\to\your\image.jpg");
var page = engine.Process(image);
var text = page.GetText();
image.Dispose();
page.Dispose();
engine.Dispose();
Console.WriteLine(text);
}
}
}
Kép konvertálása kereshető PDF-formátumba C# .NET-en keresztül
A Tesseract nyílt forráskódú C# könyvtár néhány hasznos funkciót tartalmaz a képek C# kód használatával kereshető PDF dokumentumokká konvertálásához. A könyvtár különböző kimeneti formátumok támogatását is tartalmazza, például egyszerű szöveg, hOCR (HTML), PDF, csak láthatatlan szöveges PDF, TSV, ALTO és még sok más. Ne feledje, hogy a jobb OCR-eredmények elérése érdekében a fejlesztőknek javítaniuk kell a Tesseract számára átadott képek minőségét. A következő példa bemutatja, hogyan hozhat létre kereshető PDF-dokumentumot, amely tartalmazza a képből felismert szöveget.
Kép konvertálása kereshető PDF formátumba C# .NET használatával
using (var engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.Default))
{
using (var img = Pix.LoadFromFile(testImagePath))
{
using (var page = engine.Process(img))
{
var text = page.GetText();
Console.WriteLine("Mean confidence: {0}", page.GetMeanConfidence());
Console.WriteLine("Text (GetText): \r\n{0}", text);
Console.WriteLine("Text (iterator):");
}
}
}
FORMAT_PLAINTEXT);