Aspose.OCR for .NET
Toonaangevende .NET OCR API voor optische tekenherkenningsbewerkingen
Top .NET API voor het toevoegen van Optical Character Recognition (OCR)-functionaliteit binnen C#-applicaties. Hiermee kunt u gedrukte of handgeschreven tekst naar digitaal formaat converteren.
Optische tekenherkenning (OCR) is een zeer nuttig proces voor het transformeren van tekstafbeeldingen en afgedrukte documenten naar een machinaal leesbaar tekstformaat. Aspose.OCR voor .NET is een geavanceerde OCR-bibliotheek waarmee softwareontwikkelaars zowel gedrukte als handgeschreven documenten of tekst gemakkelijk naar digitaal formaat kunnen converteren, waardoor het gemakkelijker wordt om deze te doorzoeken, bewerken en delen met andere gebruikers. De C# .NET-bibliotheek bevat een krachtige afbeeldingslezer die verschillende populaire afbeeldingsbestandsindelingen kan lezen, zoals JPEG, PNG, TIFF, GIF, BMP-afbeeldingen, PDF-documenten, TIFF, DjVu en nog veel meer. Het is voor softwareontwikkelaars ook mogelijk om de herkenningsresultaten op te slaan in het meest populaire document- en gegevensuitwisselingsformaat.
Aspose.OCR voor .NET is een van de toonaangevende OCR-bibliotheken op de markt waarmee softwareontwikkelaars OCR-functionaliteit aan hun .NET-applicaties kunnen toevoegen zonder enige externe afhankelijkheden. De bibliotheek gebruikt geavanceerde algoritmen om tekst uit gescande documenten, afbeeldingen, handgeschreven tekst, smartphonefoto's, schermafbeeldingen, specifieke delen van afbeeldingen en andere bronnen te herkennen en deze vervolgens gemakkelijk om te zetten in bewerkbare tekst. Het ondersteunt meer dan 26 talen, waaronder Engels, Chinees, Koreaans, Spaans, Frans, Duits, Italiaans, Bulgaars, Kazachs, Russisch, Japans en Arabisch.
Aspose.OCR voor .NET is zeer stabiel en bevat een zeer nuttige functie voor streepjescodeherkenning waarmee softwareontwikkelaars populaire streepjescodeformaten kunnen herkennen, zoals QR-codes en UPC-codes. De bibliotheek heeft een aantal krachtige voorverwerkingsfilters toegevoegd waarmee programmeurs geroteerde, scheve en ruisrijke afbeeldingen kunnen herkennen met slechts een paar regels C#-code. Bovendien kan het eenvoudig worden geïntegreerd met andere Aspose-bibliotheken, zoals Aspose.PDF en Aspose.Words, waardoor ontwikkelaars krachtige workflows voor documentverwerking kunnen creëren. Het is ook heel eenvoudig om afbeeldingen die als weblinks zijn aangeboden te herkennen en batchherkenning uit te voeren van alle afbeeldingen in een map of archief.
Aan de slag met Aspose.OCR voor .NET
De aanbevolen manier om Aspose.OCR voor .NET te installeren is met behulp van NuGet. Gebruik het volgende commando voor een vlotte installatie.
Installeer Aspose.Pdf via NuGet Command
Install-Package Aspose.OCR
U kunt de bibliotheek rechtstreeks downloaden vanaf de Aspose.PDF productpagina
Detecteer een bepaald gebied van een afbeelding via C#
Aspose.OCR voor .NET biedt de mogelijkheid om een bepaald gebied in de afbeelding binnen .NET-toepassingen te detecteren. Een gescande tekstafbeelding of foto kan tekstparagrafen, tabellen, illustraties, formules en meer omvatten. Het detecteren, ordenen en classificeren van interessegebieden op een pagina is de hoeksteen van succesvolle en nauwkeurige OCR. Om deze taak te volbrengen zijn er verschillende detectie-algoritmen voor documentgebieden in de bibliotheek opgenomen die softwareontwikkelaars helpen een bepaald type inhoud te detecteren. Hieronder ziet u hoe u een afbeelding laadt en een bepaald gebied voor tekstherkenning detecteert met behulp van C#-opdrachten.
Hoe kan ik een afbeelding laden en een bepaald afbeeldingsgebied detecteren via de C# API?
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add an image to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source.png");
// Set document areas detection mode
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = Aspose.OCR.DetectAreasMode.DOCUMENT;
// Recognize image
List results = recognitionEngine.Recognize(input, recognitionSettings);
foreach(Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
Afbeeldingen verwerken via .NET API
Aspose.OCR voor .NET stelt softwareontwikkelaars in staat verschillende soorten bewerkingen uit te voeren op afbeeldingen in hun eigen .NET-applicaties. De bibliotheek heeft verschillende volledig geautomatiseerde en handmatige beeldverwerkingsfilters opgenomen waarmee gebruikers hun afbeeldingen kunnen verbeteren voordat ze de OCR-bewerkingen uitvoeren, zoals scheefstandcorrectie, rotatie, ruisverwijdering, contrastcorrectie, formaat wijzigen, binarisatie, conversie naar grijswaarden, kleurinversie, dilatatie , Mediaanfilter en nog veel meer. Er zijn nog veel meer opties en instellingen die u kunt gebruiken om het OCR-proces aan te passen. Voor het verbeteren van de beeldherkenningskwaliteit kunnen ontwikkelaars meerdere verwerkingsfilters toepassen. Ontwikkelaars kunnen eenvoudig talloze filters toepassen op specifieke delen van een afbeelding.
Pas filters toe op afbeeldingen met behulp van de C# .NET API
Aspose.Drawing.Rectangle blackRectangle = new Aspose.Drawing.Rectangle(5, 161, 340, 113);
Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter filters = new Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter();
// (1) Invert black region
filters.Add(Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter.Invert(blackRectangle));
// (2) Denoise entire image
filters.Add(Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter.AutoDenoising());
Tekstvergelijking in afbeeldingen via .NET API
Aspose.OCR voor .NET geeft softwareontwikkelaars de mogelijkheid om tekst op twee afbeeldingen in hun eigen C#-applicaties te vergelijken. De bibliotheek kan teksten op twee afbeeldingen vergelijken, ongeacht het lettertype, de tekstgrootte, hoofdlettergebruik, stijlen en kleuren. Eén manier om de tekst van afbeeldingen te vergelijken door tekst uit de afbeeldingen te extraheren. Zodra u de tekst uit de afbeeldingen hebt geëxtraheerd, kunt u elk tekstvergelijkingsalgoritme gebruiken om ze te vergelijken. Aspose.OCR voor .NET biedt een eenvoudige manier om twee tekenreeksen te vergelijken met behulp van de String.Equals-methode. Het volgende voorbeeld laat zien hoe u tekst in twee afbeeldingen kunt vergelijken met behulp van C#-code.
Hoe tekst in twee afbeeldingen vergelijken met de .NET API?
using System;
using Aspose.OCR;
using System.Drawing;
class Program
{
static void Main()
{
// Load the images
var image1 = Image.FromFile("image1.png");
var image2 = Image.FromFile("image2.png");
// Extract text from the images
var ocrEngine = new OcrEngine();
ocrEngine.Image = ImageStream.FromImage(image1);
ocrEngine.Process();
var text1 = ocrEngine.Text;
ocrEngine.Image = ImageStream.FromImage(image2);
ocrEngine.Process();
var text2 = ocrEngine.Text;
// Compare the extracted text
var areEqual = string.Equals(text1, text2, StringComparison.OrdinalIgnoreCase);
Console.WriteLine("Are the texts equal? " + areEqual);
}
}
//Note that the above code only works for exact text matches.
Zoek tekst in een afbeelding met behulp van de C# API
Aspose.OCR voor .NET maakt het gemakkelijk voor softwareontwikkelaars om tekst in een afbeelding te vinden in hun eigen .NET-applicaties. De bibliotheek heeft ondersteuning geboden voor het zoeken naar tekst in afbeeldingen, net zo eenvoudig als het vinden van het tekstfragment in een string. De bibliotheek ondersteunt het zoeken naar een hoofdlettergevoelige of hoofdletterongevoelige tekenreeks, en valideert zelfs een afbeeldingstekst aan de hand van een patroon. Softwareontwikkelaars kunnen de ImageHasText-methode gebruiken om tekst in een afbeelding te zoeken met slechts een paar regels C#-code. Het volgende voorbeeld laat zien hoe u een afbeelding laadt en daarin naar een bepaalde tekst zoekt.
Hoe vind ik tekst in een afbeelding via .NET?
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Ukr;
if(recognitionEngine.ImageHasText("source.png", "Aspose", recognitionSettings))
{
Console.WriteLine(@"The image contains the word ""Aspose""");
}
else
{
Console.WriteLine(@"The image doesn't contain the word ""Aspose""");
}