Aspose.OCR for .NET
Führende .NET OCR-API für optische Zeichenerkennungsvorgänge
Top .NET-API zum Hinzufügen von OCR-Funktionen (Optical Character Recognition) in C#-Anwendungen. Ermöglicht die Konvertierung von gedrucktem oder handgeschriebenem Text in ein digitales Format.
Die optische Zeichenerkennung (OCR) ist ein sehr nützlicher Prozess zum Umwandeln von Textbildern sowie gedruckten Dokumenten in ein maschinenlesbares Textformat. Aspose.OCR für .NET ist eine erweiterte OCR-Bibliothek, die es Softwareentwicklern erleichtert, gedruckte sowie handschriftliche Dokumente oder Texte in ein digitales Format umzuwandeln, wodurch das Suchen, Bearbeiten und Teilen mit anderen Benutzern erleichtert wird. Die C# .NET-Bibliothek enthält einen leistungsstarken Bildleser, der verschiedene gängige Bilddateiformate wie JPEG, PNG, TIFF, GIF, BMP-Bilder, PDF-Dokumente, TIFF, DjVu und viele mehr lesen kann. Softwareentwickler können die Erkennungsergebnisse auch im gängigsten Dokument- und Datenaustauschformat speichern.
Aspose.OCR für .NET ist eine der führenden OCR-Bibliotheken auf dem Markt, die es Softwareentwicklern ermöglicht, ihren .NET-Anwendungen OCR-Funktionen ohne externe Abhängigkeiten hinzuzufügen. Die Bibliothek verwendet fortschrittliche Algorithmen, um Text aus gescannten Dokumenten, Bildern, handschriftlichem Text, Smartphone-Fotos, Screenshots, bestimmten Bildbereichen und anderen Quellen zu erkennen und ihn dann problemlos in bearbeitbaren Text umzuwandeln. Sie unterstützt mehr als 26 Sprachen, darunter Englisch, Chinesisch, Koreanisch, Spanisch, Französisch, Deutsch, Italienisch, Bulgarisch, Kasachisch, Russisch, Japanisch und Arabisch.
Aspose.OCR für .NET ist sehr stabil und verfügt über eine sehr nützliche Funktion zur Barcode-Erkennung, mit der Softwareentwickler gängige Barcode-Formate wie QR-Codes und UPC-Codes erkennen können. Die Bibliothek enthält einige leistungsstarke Vorverarbeitungsfilter, mit denen Programmierer gedrehte, verzerrte und verrauschte Bilder mit nur wenigen Zeilen C#-Code erkennen können. Darüber hinaus kann sie problemlos in andere Aspose-Bibliotheken wie Aspose.PDF und Aspose.Words integriert werden, sodass Entwickler leistungsstarke Workflows zur Dokumentverarbeitung erstellen können. Es ist auch sehr einfach, als Weblinks bereitgestellte Bilder zu erkennen und eine Stapelerkennung aller Bilder in einem Ordner oder Archiv durchzuführen.
Erste Schritte mit Aspose.OCR für .NET
Die empfohlene Methode zur Installation von Aspose.OCR für .NET ist die Verwendung von NuGet. Bitte verwenden Sie den folgenden Befehl für eine reibungslose Installation.
Installieren Sie Aspose.Pdf über den NuGet-Befehl
Install-Package Aspose.OCR
Sie können die Bibliothek direkt von der Aspose.PDF-Produktseite herunterladen
Bestimmten Bereich eines Bildes über C# erkennen
Aspose.OCR für .NET bietet die Möglichkeit, einen bestimmten Bereich im Bild innerhalb von .NET-Anwendungen zu erkennen. Ein gescanntes Textbild oder Foto kann Textabsätze, Tabellen, Abbildungen, Formeln und mehr enthalten. Das Erkennen, Ordnen und Klassifizieren von interessanten Bereichen auf einer Seite ist der Grundstein für erfolgreiches und genaues OCR. Um diese Aufgabe zu erfüllen, gibt es mehrere Algorithmen zur Erkennung von Dokumentbereichen, die Teil der Bibliothek sind und Softwareentwicklern helfen, einen bestimmten Inhaltstyp zu erkennen. Im Folgenden wird gezeigt, wie Sie ein Bild laden und einen bestimmten Bereich für die Texterkennung mit C#-Befehlen erkennen.
Wie lade ich ein Bild und erkenne einen bestimmten Bildbereich über die C#-API?
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add an image to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source.png");
// Set document areas detection mode
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = Aspose.OCR.DetectAreasMode.DOCUMENT;
// Recognize image
List results = recognitionEngine.Recognize(input, recognitionSettings);
foreach(Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
Bilder über .NET API verarbeiten
Aspose.OCR für .NET ermöglicht Softwareentwicklern, verschiedene Arten von Operationen an Bildern in ihren eigenen .NET-Anwendungen durchzuführen. Die Bibliothek enthält mehrere vollautomatische und manuelle Bildverarbeitungsfilter, mit denen Benutzer ihre Bilder vor der Durchführung der OCR-Operationen verbessern können, z. B. Schräglagenkorrektur, Drehung, Rauschunterdrückung, Kontrastkorrektur, Größenänderung, Binärisierung, Konvertierung in Graustufen, Farbumkehrung, Dilatation, Medianfilter und vieles mehr. Es gibt viele weitere Optionen und Einstellungen, mit denen Sie den OCR-Prozess anpassen können. Zur Verbesserung der Bilderkennungsqualität können Entwickler mehrere Verarbeitungsfilter anwenden. Entwickler können problemlos zahlreiche Filter auf bestimmte Bereiche eines Bildes anwenden.
Filter auf Bilder anwenden mit C# .NET API
Aspose.Drawing.Rectangle blackRectangle = new Aspose.Drawing.Rectangle(5, 161, 340, 113);
Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter filters = new Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter();
// (1) Invert black region
filters.Add(Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter.Invert(blackRectangle));
// (2) Denoise entire image
filters.Add(Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter.AutoDenoising());
Textvergleich in Bildern über .NET API
Aspose.OCR für .NET bietet Softwareentwicklern die Möglichkeit, Text auf zwei Bildern in ihren eigenen C#-Anwendungen zu vergleichen. Die Bibliothek kann Texte auf zwei Bildern unabhängig von Schriftart, Textgröße, Groß-/Kleinschreibung, Stil und Farbe vergleichen. Eine Möglichkeit, Bildtext zu vergleichen, besteht darin, Text aus den Bildern zu extrahieren. Nachdem Sie den Text aus den Bildern extrahiert haben, können Sie jeden beliebigen Textvergleichsalgorithmus verwenden, um sie zu vergleichen. Aspose.OCR für .NET bietet eine einfache Möglichkeit, zwei Zeichenfolgen mit der Methode String.Equals zu vergleichen. Das folgende Beispiel zeigt, wie Sie Text in zwei Bildern mit C#-Code vergleichen.
Wie vergleicht man Text in zwei Bildern mithilfe der .NET-API?
using System;
using Aspose.OCR;
using System.Drawing;
class Program
{
static void Main()
{
// Load the images
var image1 = Image.FromFile("image1.png");
var image2 = Image.FromFile("image2.png");
// Extract text from the images
var ocrEngine = new OcrEngine();
ocrEngine.Image = ImageStream.FromImage(image1);
ocrEngine.Process();
var text1 = ocrEngine.Text;
ocrEngine.Image = ImageStream.FromImage(image2);
ocrEngine.Process();
var text2 = ocrEngine.Text;
// Compare the extracted text
var areEqual = string.Equals(text1, text2, StringComparison.OrdinalIgnoreCase);
Console.WriteLine("Are the texts equal? " + areEqual);
}
}
//Note that the above code only works for exact text matches.
Text in einem Bild mithilfe der C#-API suchen
Aspose.OCR für .NET macht es Softwareentwicklern leicht, Text in einem Bild in ihren eigenen .NET-Anwendungen zu finden. Die Bibliothek bietet Unterstützung für die Suche nach Text in Bildern, die so einfach ist wie das Suchen nach einem Textfragment in einer Zeichenfolge. Die Bibliothek unterstützt die Suche nach einer Zeichenfolge, bei der Groß- und Kleinschreibung beachtet wird, und validiert sogar einen Bildtext anhand eines Musters. Softwareentwickler können die Methode ImageHasText verwenden, um mit nur ein paar Zeilen C#-Code nach Text in einem Bild zu suchen. Das folgende Beispiel zeigt, wie ein Bild geladen und darin nach einem bestimmten Text gesucht wird.
Wie findet man über .NET Text in einem Bild?
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Ukr;
if(recognitionEngine.ImageHasText("source.png", "Aspose", recognitionSettings))
{
Console.WriteLine(@"The image contains the word ""Aspose""");
}
else
{
Console.WriteLine(@"The image doesn't contain the word ""Aspose""");
}