Aspose.OCR for .NET
Førende .NET OCR API til operationer for optisk tegngenkendelse
Top .NET API til tilføjelse af OCR-funktionalitet (Optical Character Recognition) i C#-applikationer. Det gør det muligt at konvertere trykt eller håndskrevet tekst til digitalt format.
Optical Character Recognition (OCR) er en meget nyttig proces til at transformere tekstbilleder såvel som udskrevne dokumenter til et maskinlæsbart tekstformat. Aspose.OCR for .NET er et avanceret OCR-bibliotek, der gør det nemt for softwareudviklere at konvertere trykte såvel som håndskrevne dokumenter eller tekst til digitalt format, hvilket gør det nemmere at søge, redigere og dele det med andre brugere. C# .NET-biblioteket har inkluderet en kraftfuld billedlæser, der kan læse forskellige populære billedfilformater såsom JPEG, PNG, TIFF, GIF, BMP-billeder, PDF-dokumenter, TIFF, DjVu og mange flere. Det er også muligt for softwareudviklere at gemme genkendelsesresultaterne i det mest populære dokument- og dataudvekslingsformat.
Aspose.OCR til .NET er et af de førende OCR-biblioteker på markedet, der gør det muligt for softwareudviklere at tilføje OCR-funktionalitet til deres .NET-applikationer uden nogen ekstern afhængighed. Biblioteket bruger avancerede algoritmer til at genkende tekst fra scannede dokumenter, billeder, håndskrevet tekst, smartphone-fotos, skærmbilleder, specifikke områder af billeder og andre kilder og derefter konvertere den til redigerbar tekst med lethed. Det understøtter mere end 26 sprog, inklusive engelsk, kinesisk, koreansk, spansk, fransk, tysk, italiensk, bulgarsk, kasakhisk, russisk, japansk og arabisk.
Aspose.OCR til .NET er meget stabil og har inkluderet en meget nyttig funktion til stregkodegenkendelse, der gør det muligt for softwareudviklere at genkende populære stregkodeformater, såsom QR-koder og UPC-koder. Biblioteket har inkluderet nogle kraftfulde forbehandlingsfiltre, der gør det muligt for programmører at genkende roterede, skæve og støjende billeder med blot et par linjer C#-kode. Desuden kan det nemt integreres med andre Aspose-biblioteker, såsom Aspose.PDF og Aspose.Words, hvilket giver udviklere mulighed for at skabe kraftfulde dokumentbehandlingsarbejdsgange. Det er også meget nemt at genkende billeder leveret som weblinks og udføre batchgenkendelse af alle billeder i en mappe eller et arkiv.
Kom godt i gang med Aspose.OCR for .NET
Den anbefalede måde at installere Aspose.OCR til .NET på er at bruge NuGet. Brug venligst følgende kommando for en problemfri installation.
Installer Aspose.Pdf via NuGet Command
Install-Package Aspose.OCR
Du kan downloade biblioteket direkte fra Aspose.PDF produktside
Opdag et bestemt område af et billede via C#
Aspose.OCR til .NET har givet mulighed for at detektere et bestemt område i billedet inde i .NET-applikationer. Et scannet tekstbillede eller fotografi kan omfatte tekstafsnit, tabeller, illustrationer, formler og mere. Registrering, bestilling og klassificering af interesseområder på en side er hjørnestenen i vellykket og nøjagtig OCR. For at udføre opgaven er der flere dokumentområder detektionsalgoritmer en del af biblioteket, der hjælper softwareudviklere med at opdage en bestemt type indhold. Det følgende viser, hvordan man indlæser et billede og detekterer et bestemt område til tekstgenkendelse ved hjælp af C#-kommandoer.
Hvordan indlæses billede og registreres et bestemt billedområde via C# API?
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add an image to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source.png");
// Set document areas detection mode
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = Aspose.OCR.DetectAreasMode.DOCUMENT;
// Recognize image
List results = recognitionEngine.Recognize(input, recognitionSettings);
foreach(Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
Behandle billeder via .NET API
Aspose.OCR til .NET giver softwareudviklere mulighed for at udføre forskellige typer operationer på billeder i deres egne .NET-applikationer. Biblioteket har inkluderet flere fuldautomatiske og manuelle billedbehandlingsfiltre, der hjælper brugere med at forbedre deres billeder, før de udfører OCR-handlinger, såsom skævhedskorrektion, rotation, fjernelse af støj, kontrastkorrektion, ændring af størrelse, binarisering, konvertering til gråtoner, farveinversion, dilatation , Median filter og mange flere. Der er mange andre muligheder og indstillinger, som du kan bruge til at tilpasse OCR-processen. For at forbedre billedgenkendelseskvaliteten kan udviklere anvende flere behandlingsfiltre. Udviklere kan nemt anvende adskillige filtre til bestemte områder af et billede.
Anvend filtre på billeder ved hjælp af C# .NET API
Aspose.Drawing.Rectangle blackRectangle = new Aspose.Drawing.Rectangle(5, 161, 340, 113);
Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter filters = new Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter();
// (1) Invert black region
filters.Add(Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter.Invert(blackRectangle));
// (2) Denoise entire image
filters.Add(Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter.AutoDenoising());
Tekstsammenligning i billeder via .NET API
Aspose.OCR til .NET giver softwareudviklere mulighed for at sammenligne tekst på to billeder i deres egne C#-applikationer. Biblioteket kan sammenligne tekster på to billeder, uanset skrifttype, tekststørrelse, case, stilarter og farver. En måde at sammenligne billedtekst ved at udtrække tekst fra billederne, og når du har udtrukket teksten fra billederne, kan du bruge en hvilken som helst tekstsammenligningsalgoritme til at sammenligne dem. Aspose.OCR til .NET giver en enkel måde at sammenligne to strenge ved hjælp af String.Equals-metoden. Følgende eksempel t viser, hvordan man sammenligner tekst i to billeder ved hjælp af C#-kode.
Hvordan sammenligner man tekst i to billeder ved hjælp af .NET API?
using System;
using Aspose.OCR;
using System.Drawing;
class Program
{
static void Main()
{
// Load the images
var image1 = Image.FromFile("image1.png");
var image2 = Image.FromFile("image2.png");
// Extract text from the images
var ocrEngine = new OcrEngine();
ocrEngine.Image = ImageStream.FromImage(image1);
ocrEngine.Process();
var text1 = ocrEngine.Text;
ocrEngine.Image = ImageStream.FromImage(image2);
ocrEngine.Process();
var text2 = ocrEngine.Text;
// Compare the extracted text
var areEqual = string.Equals(text1, text2, StringComparison.OrdinalIgnoreCase);
Console.WriteLine("Are the texts equal? " + areEqual);
}
}
//Note that the above code only works for exact text matches.
Søg efter tekst i et billede ved hjælp af C# API
Aspose.OCR til .NET gør det nemt for softwareudviklere at finde tekst i et billede i deres egne .NET-applikationer. Biblioteket har givet støtte til at søge tekst i billeder lige så let som at finde tekstfragmentet i en streng. Biblioteket understøtter søgning efter en streng, der skelner mellem store og små bogstaver, og validerer endda en billedtekst mod et mønster. Softwareudviklere kan bruge ImageHasText-metoden til at søge efter tekst inde i et billede med blot et par linjer C#-kode. Følgende eksempel viser, hvordan man indlæser et billede og søger efter en bestemt tekst inde i det.
Hvordan finder man tekst i et billede via .NET?
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Ukr;
if(recognitionEngine.ImageHasText("source.png", "Aspose", recognitionSettings))
{
Console.WriteLine(@"The image contains the word ""Aspose""");
}
else
{
Console.WriteLine(@"The image doesn't contain the word ""Aspose""");
}