1. Termékek
  2.   OCR
  3.   .NET
  4.   Tesseract
 
  

Nyílt forráskódú .NET API az OCR-hez szövegek és képek feldolgozásához

Nyílt forráskódú .NET Optical Character Recognition (OCR) API, amellyel szöveget tartalmazó képeket (beolvasott képeket és PDF-fájlokat) gépileg olvasható szöveggé alakítanak át.

A Tesseract egy nagyon hatékony, nyílt forráskódú optikai karakterfelismerő (OCR) motor, amely lehetővé teszi a szoftverfejlesztők számára, hogy különféle típusú, szöveget tartalmazó képeket gépileg olvasható szöveggé alakítsanak át Python-alkalmazásokon belül. A nyílt forráskódú technológia forradalmasította a szoftverfejlesztők alkalmazásaik elkészítésének módját azáltal, hogy megkönnyítette számukra a hatékony eszközök és könyvtárak elérését és integrálását alkalmazásaikba. Ez egy .NET-burkoló a tesseract-ocr számára, és számos alkalmazásban használható, a dokumentumok beolvasásától és adatkinyerésétől az automatikus képfelismerésig és -fordításig.

A Tesseract-et eredetileg az 1980-as években fejlesztette ki a Hewlett-Packard, majd 2005-ben nyílt forráskódú projektként adták ki. Azóta a világ egyik legszélesebb körben használt OCR motorjává vált az Unicode (UTF) támogatásával. -8), több mint 100 nyelv, valamint a képformátumok széles skálájának feldolgozásának képessége. Az API-nak számos olyan funkciója van, mint például a dokumentumok szkennelése, a dokumentumok digitalizálása, a dokumentumok kereshetővé tétele, a géppel olvasható dokumentumok létrehozása, az OCR teljesítményének optimalizálása és még sok más.

A Tesseract nagyon könnyen kezelhető, és úgy tervezték, hogy felismerje a szöveget a digitális képeken belül számos képformátumban, például JPEG, BMP, PSD, PNG, TIFF és sok más formátumban. A könyvtár nagymértékben testreszabható, és számos opcióval optimalizálható az OCR teljesítménye különböző típusú képekhez és szövegekhez. Függetlenül attól, hogy dokumentumok szkennelésével és digitalizálásával, adatkinyeréssel vagy képfelismeréssel és fordítással foglalkozik, a Tesseract hatékony és megbízható megoldást kínál, amellyel gyorsan és egyszerűen elérheti céljait.

Previous Next

Kezdő lépések a Tesseracttel

A Tesseract telepítésének javasolt módja a NuGet használata. Kérjük, használja a következő parancsot a zökkenőmentes telepítés érdekében.

Tesseract telepítése NuGet segítségével

 Install-Package Tesseract 

Tesseract telepítése GitHubon keresztül

 git clone https://github.com/charlesw/tesseract.git 

Alapszöveg kinyerése egy képből C#-on keresztül

A Tesseract nyílt forráskódú C# könyvtár lehetővé teszi a szoftverfejlesztők számára, hogy szöveget vonjanak ki egy képből saját .NET-alkalmazásaikon belül. A könyvtár segítségével a szoftverfejlesztők könnyen visszakereshetik a beolvasott dokumentumok vagy képek szöveges tartalmát, és felhasználhatják azt további feldolgozásra vagy elemzésre. A feladat végrehajtásához a fejlesztőknek először importálniuk kell a Tesseract névteret a kódfájlba, és létre kell hozniuk a Tesseract motor egy példányát. A következő példa bemutatja, hogyan lehet kivonni az alapszöveget a képből, és kiadni a konzolra.

Hogyan lehet kinyerni az alapszöveget a képből C# API-n keresztül?

using Tesseract;
using System.Drawing;

namespace MyNamespace
{
    class Program
    {
        static void Main(string[] args)
        {
            var engine = new TesseractEngine("./tessdata", "eng", EngineMode.Default);
            var image = new Bitmap(@"C:\path\to\your\image.jpg");
            var page = engine.Process(image);
            var text = page.GetText();
            image.Dispose();
            page.Dispose();
            engine.Dispose();
            Console.WriteLine(text);
        }
    }
}

Kép konvertálása kereshető PDF-formátumba C# .NET-en keresztül

A Tesseract nyílt forráskódú C# könyvtár néhány hasznos funkciót tartalmaz a képek C# kód használatával kereshető PDF dokumentumokká konvertálásához. A könyvtár különböző kimeneti formátumok támogatását is tartalmazza, például egyszerű szöveg, hOCR (HTML), PDF, csak láthatatlan szöveges PDF, TSV, ALTO és még sok más. Ne feledje, hogy a jobb OCR-eredmények elérése érdekében a fejlesztőknek javítaniuk kell a Tesseract számára átadott képek minőségét. A következő példa bemutatja, hogyan hozhat létre kereshető PDF-dokumentumot, amely tartalmazza a képből felismert szöveget.

Kép konvertálása kereshető PDF formátumba C# .NET használatával

using (var engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.Default))
    {
        using (var img = Pix.LoadFromFile(testImagePath))
        {
            using (var page = engine.Process(img))
            {
                var text = page.GetText();
                Console.WriteLine("Mean confidence: {0}", page.GetMeanConfidence());

                Console.WriteLine("Text (GetText): \r\n{0}", text);
                Console.WriteLine("Text (iterator):");
                }
        }
    }
FORMAT_PLAINTEXT);
 Magyar