1. Produkter
  2.   OCR
  3.   .NET
  4.   Tesseract
 
  

Open Source .NET API for OCR for å behandle tekst og bilder

Open Source .NET Optical Character Recognition (OCR) API brukes til å konvertere bilder (skannede bilder og PDF-filer) som inneholder tekst til maskinlesbar tekst.

Tesseract er en veldig kraftig åpen kildekode-motor for optisk tegngjenkjenning (OCR) som gjør det mulig for programvareutviklere å konvertere ulike typer bilder som inneholder tekst til maskinlesbar tekst i Python-applikasjoner. Åpen kildekode-teknologi har revolusjonert måten programvareutviklere bygger applikasjonene sine på ved å gjøre det enklere for dem å få tilgang til og integrere kraftige verktøy og biblioteker i applikasjonene sine. Det er en .NET-innpakning for tesseract-ocr og kan brukes i en lang rekke applikasjoner, fra dokumentskanning og datautvinning til automatisert bildegjenkjenning og oversettelse.

Tesseract ble opprinnelig utviklet på 1980-tallet av Hewlett-Packard og ble senere utgitt som et åpen kildekode-prosjekt i 2005. Siden den gang har det blitt en av de mest brukte OCR-motorene i verden, med støtte for Unicode (UTF) -8), over 100 språk, og muligheten til å behandle et bredt spekter av bildeformater. Det er ulike funksjoner i API-et som dokumentskanning, dokumentdigitalisering, gjøre dokumenter søkbare, lage maskinlesbare dokumenter, optimalisere OCR-ytelse og mye mer.

Tesseract er veldig enkelt å håndtere og er designet for å gjenkjenne tekst i digitale bilder i en lang rekke bildeformater, som JPEG, BMP, PSD, PNG, TIFF og mange flere. Biblioteket er svært tilpassbart, med et bredt spekter av alternativer som kan brukes til å optimalisere OCR-ytelsen for ulike typer bilder og tekst. Enten du jobber med dokumentskanning og digitalisering, datautvinning eller bildegjenkjenning og oversettelse, tilbyr Tesseract en kraftig og pålitelig løsning som kan hjelpe deg med å nå dine mål raskt og enkelt.

Previous Next

Kom i gang med Tesseract

Den anbefalte måten å installere Tesseract på er å bruke NuGet. Bruk følgende kommando for en jevn installasjon.

Installer Tesseract via NuGet

 Install-Package Tesseract 

Installer Tesseract via GitHub

 git clone https://github.com/charlesw/tesseract.git 

trekk ut grunnleggende tekst fra et bilde via C#

Open source C#-biblioteket Tesseract gjør det mulig for programvareutviklere å trekke ut tekst fra et bilde i sine egne .NET-applikasjoner. Biblioteket gjør det enkelt for programvareutviklere å enkelt hente frem tekstinnholdet i skannede dokumenter eller bilder, og bruke det til videre bearbeiding eller analyse. For å oppnå oppgaven må utviklerne først importere Tesseract-navneområdet i kodefilen din og opprette en forekomst av Tesseract-motoren. Følgende eksempel viser hvordan du trekker ut den grunnleggende teksten fra bildet og sender den ut til konsollen.

Hvordan trekke ut den grunnleggende teksten fra bildet via C# API?

using Tesseract;
using System.Drawing;

namespace MyNamespace
{
    class Program
    {
        static void Main(string[] args)
        {
            var engine = new TesseractEngine("./tessdata", "eng", EngineMode.Default);
            var image = new Bitmap(@"C:\path\to\your\image.jpg");
            var page = engine.Process(image);
            var text = page.GetText();
            image.Dispose();
            page.Dispose();
            engine.Dispose();
            Console.WriteLine(text);
        }
    }
}

Konverter bilde til søkbar PDF via C# .NET

Open source C#-biblioteket Tesseract har inkludert noen nyttige funksjoner for å konvertere bilder til søkbare PDF-dokumenter ved hjelp av C#-kode. Biblioteket har også inkludert støtte for ulike utdataformater, for eksempel ren tekst, hOCR (HTML), PDF, PDF, TSV, ALTO og mange flere. Husk at for å få bedre OCR-resultater, må utviklerne forbedre kvaliteten på bildene de skal gi til Tesseract. Følgende eksempel viser hvordan du oppretter et søkbart PDF-dokument som inneholder den gjenkjente teksten fra bildet.

Hvordan konvertere bilde til søkbar PDF ved hjelp av C# .NET

using (var engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.Default))
    {
        using (var img = Pix.LoadFromFile(testImagePath))
        {
            using (var page = engine.Process(img))
            {
                var text = page.GetText();
                Console.WriteLine("Mean confidence: {0}", page.GetMeanConfidence());

                Console.WriteLine("Text (GetText): \r\n{0}", text);
                Console.WriteLine("Text (iterator):");
                }
        }
    }
FORMAT_PLAINTEXT);
 Norsk