Aspose.OCR for .NET
Ledande .NET OCR API för operationer för optisk teckenigenkänning
Topp .NET API för att lägga till funktionalitet för optisk teckenigenkänning (OCR) i C#-applikationer. Det gör det möjligt att konvertera tryckt eller handskriven text till digitalt format.
Optical Character Recognition (OCR) är en mycket användbar process för att omvandla textbilder såväl som utskrivna dokument till ett maskinläsbart textformat. Aspose.OCR för .NET är ett avancerat OCR-bibliotek som gör det enkelt för programutvecklare att konvertera såväl tryckta som handskrivna dokument eller text till digitalt format, vilket gör det lättare att söka, redigera och dela det med andra användare. C# .NET-biblioteket har inkluderat en kraftfull bildläsare som kan läsa olika populära bildfilformat som JPEG, PNG, TIFF, GIF, BMP-bilder, PDF-dokument, TIFF, DjVu och många fler. Det är också möjligt för mjukvaruutvecklare att lagra igenkänningsresultaten i det mest populära dokument- och datautbytesformatet.
Aspose.OCR för .NET är ett av de ledande OCR-biblioteken på marknaden som gör det möjligt för mjukvaruutvecklare att lägga till OCR-funktionalitet till sina .NET-applikationer utan några externa beroenden. Biblioteket använder avancerade algoritmer för att känna igen text från skannade dokument, bilder, handskriven text, smartphonefoton, skärmdumpar, specifika delar av bilder och andra källor och konverterar den sedan till redigerbar text med lätthet. Den stöder mer än 26 språk, inklusive engelska, kinesiska, koreanska, spanska, franska, tyska, italienska, bulgariska, kazakiska, ryska, japanska och arabiska.
Aspose.OCR för .NET är mycket stabil och har inkluderat en mycket användbar funktion för igenkänning av streckkoder som gör det möjligt för mjukvaruutvecklare att känna igen populära streckkodsformat, såsom QR-koder och UPC-koder. Biblioteket har inkluderat några kraftfulla förbehandlingsfilter som gör att programmerare kan känna igen roterade, sneda och brusiga bilder med bara ett par rader C#-kod. Dessutom kan det enkelt integreras med andra Aspose-bibliotek, såsom Aspose.PDF och Aspose.Words, vilket gör att utvecklare kan skapa kraftfulla arbetsflöden för dokumentbearbetning. Det är också mycket lätt att känna igen bilder som tillhandahålls som webblänkar och utföra batchigenkänning av alla bilder i en mapp eller arkiv.
Komma igång med Aspose.OCR för .NET
Det rekommenderade sättet att installera Aspose.OCR för .NET är att använda NuGet. Använd följande kommando för en smidig installation.
Installera Aspose.Pdf via NuGet Command
Install-Package Aspose.OCR
Du kan ladda ner biblioteket direkt från Aspose.PDF produktsida
Detektera en viss del av en bild via C#
Aspose.OCR för .NET har gett möjligheten att upptäcka ett visst område i bilden i .NET-applikationer. En skannad textbild eller fotografi kan innehålla textstycken, tabeller, illustrationer, formler med mera. Att upptäcka, beställa och klassificera intresseområden på en sida är hörnstenen för framgångsrik och korrekt OCR. För att uppnå uppgiften finns det flera dokumentområden detekteringsalgoritmer del av biblioteket som hjälper mjukvaruutvecklare att upptäcka en viss typ av innehåll. Följande visar hur man laddar en bild och upptäcker ett visst område för textigenkänning med C#-kommandon.
Hur laddar man bild och upptäcker ett visst bildområde via C# API?
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add an image to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source.png");
// Set document areas detection mode
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = Aspose.OCR.DetectAreasMode.DOCUMENT;
// Recognize image
List results = recognitionEngine.Recognize(input, recognitionSettings);
foreach(Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
Bearbeta bilder via .NET API
Aspose.OCR för .NET tillåter programutvecklare att utföra olika typer av operationer på bilder i sina egna .NET-applikationer. Biblioteket har inkluderat flera helautomatiska och manuella bildbehandlingsfilter som hjälper användare att förbättra sina bilder innan de utför OCR-operationerna, såsom skevningskorrigering, rotation, brusborttagning, kontrastkorrigering, storleksändring, binarisering, konvertering till gråskala, färginversion, utvidgning , Medianfilter och många fler. Det finns många andra alternativ och inställningar som du kan använda för att anpassa OCR-processen. För att förbättra bildigenkänningskvaliteten kan utvecklare använda flera bearbetningsfilter. Utvecklare kan enkelt tillämpa många filter på specifika delar av en bild.
Tillämpa filter på bilder med C# .NET API
Aspose.Drawing.Rectangle blackRectangle = new Aspose.Drawing.Rectangle(5, 161, 340, 113);
Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter filters = new Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter();
// (1) Invert black region
filters.Add(Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter.Invert(blackRectangle));
// (2) Denoise entire image
filters.Add(Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter.AutoDenoising());
Textjämförelse i bilder via .NET API
Aspose.OCR för .NET ger mjukvaruutvecklare möjlighet att jämföra text på två bilder i sina egna C#-applikationer. Biblioteket kan jämföra texter på två bilder, oavsett typsnitt, textstorlek, fall, stilar och färger. Ett sätt att jämföra bildtext genom att extrahera text från bilderna och när du har extraherat texten från bilderna kan du använda vilken textjämförelsealgoritm som helst för att jämföra dem. Aspose.OCR för .NET ger ett enkelt sätt att jämföra två strängar med String.Equals-metoden. Följande exempel t visar hur man jämför text i två bilder med C#-kod.
Hur jämför man text i två bilder med .NET API?
using System;
using Aspose.OCR;
using System.Drawing;
class Program
{
static void Main()
{
// Load the images
var image1 = Image.FromFile("image1.png");
var image2 = Image.FromFile("image2.png");
// Extract text from the images
var ocrEngine = new OcrEngine();
ocrEngine.Image = ImageStream.FromImage(image1);
ocrEngine.Process();
var text1 = ocrEngine.Text;
ocrEngine.Image = ImageStream.FromImage(image2);
ocrEngine.Process();
var text2 = ocrEngine.Text;
// Compare the extracted text
var areEqual = string.Equals(text1, text2, StringComparison.OrdinalIgnoreCase);
Console.WriteLine("Are the texts equal? " + areEqual);
}
}
//Note that the above code only works for exact text matches.
Sök efter text i en bild med C# API
Aspose.OCR för .NET gör det enkelt för programutvecklare att hitta text i en bild i sina egna .NET-applikationer. Biblioteket har gett stöd för att söka text i bilder lika enkelt som att hitta textfragmentet i en sträng. Biblioteket stöder sökning efter en skiftlägeskänslig eller skiftlägesokänslig sträng och validerar till och med en bildtext mot ett mönster. Mjukvaruutvecklare kan använda ImageHasText-metoden för att söka text inuti en bild med bara ett par rader C#-kod. Följande exempel visar hur man laddar en bild och söker efter en viss text inuti den.
Hur hittar man text i en bild via .NET?
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Ukr;
if(recognitionEngine.ImageHasText("source.png", "Aspose", recognitionSettings))
{
Console.WriteLine(@"The image contains the word ""Aspose""");
}
else
{
Console.WriteLine(@"The image doesn't contain the word ""Aspose""");
}