Aspose.OCR for .NET
API OCR .NET leader per operazioni di riconoscimento ottico dei caratteri
Principali API .NET per l'aggiunta della funzionalità di riconoscimento ottico dei caratteri (OCR) all'interno delle applicazioni C#. Permette di convertire il testo stampato o scritto a mano in formato digitale.
Il riconoscimento ottico dei caratteri (OCR) è un processo molto utile per trasformare immagini di testo e documenti stampati in un formato di testo leggibile dalla macchina. Aspose.OCR per .NET è una libreria OCR avanzata che semplifica agli sviluppatori di software la conversione di documenti o testi stampati e scritti a mano in formato digitale, facilitando la ricerca, la modifica e la condivisione con altri utenti. La libreria C# .NET include un potente lettore di immagini in grado di leggere vari formati di file immagine popolari come JPEG, PNG, TIFF, GIF, immagini BMP, documenti PDF, TIFF, DjVu e molti altri. È anche possibile per gli sviluppatori di software memorizzare i risultati del riconoscimento nel formato di documento e scambio di dati più popolare.
Aspose.OCR per .NET è una delle librerie OCR leader sul mercato che consente agli sviluppatori di software di aggiungere funzionalità OCR alle proprie applicazioni .NET senza dipendenze esterne. La libreria utilizza algoritmi avanzati per riconoscere il testo da documenti scansionati, immagini, testo scritto a mano, foto di smartphone, schermate, aree specifiche di immagini e altre fonti e quindi lo converte facilmente in testo modificabile. Supporta più di 26 lingue, tra cui inglese, cinese, coreano, spagnolo, francese, tedesco, italiano, bulgaro, kazako, russo, giapponese e arabo.
Aspose.OCR per .NET è molto stabile e include una funzionalità molto utile per il riconoscimento dei codici a barre che consente agli sviluppatori di software di riconoscere i formati di codici a barre più diffusi, come codici QR e codici UPC. La libreria ha incluso alcuni potenti filtri di pre-elaborazione che consentono ai programmatori di riconoscere immagini ruotate, inclinate e rumorose con solo un paio di righe di codice C#. Inoltre, può essere facilmente integrato con altre librerie Aspose, come Aspose.PDF e Aspose.Words, consentendo agli sviluppatori di creare potenti flussi di lavoro di elaborazione dei documenti. È anche molto semplice riconoscere le immagini fornite come collegamenti Web ed eseguire il riconoscimento batch di tutte le immagini in una cartella o in un archivio.
Introduzione a Aspose.OCR per .NET
Il modo consigliato per installare Aspose.OCR per .NET è utilizzare NuGet. Si prega di utilizzare il seguente comando per un'installazione fluida.
Installa Aspose.Pdf tramite il comando NuGet
Install-Package Aspose.OCR
Puoi scaricare la libreria direttamente dalla Aspose.PDF pagina del prodotto
Rileva un'area particolare di un'immagine tramite C#
Aspose.OCR per .NET ha fornito la capacità di rilevare una particolare area nell'immagine all'interno delle applicazioni .NET. Un'immagine di testo o una fotografia scansionata può comprendere paragrafi di testo, tabelle, illustrazioni, formule e altro. Rilevare, ordinare e classificare le aree di interesse su una pagina è la pietra angolare di un OCR accurato e di successo. Per raggiungere questo obiettivo, sono presenti diversi algoritmi di rilevamento delle aree del documento, parte della libreria, che aiutano gli sviluppatori di software a rilevare un particolare tipo di contenuto. Di seguito viene illustrato come caricare un'immagine e rilevare un'area particolare per il riconoscimento del testo utilizzando i comandi C#.
Come caricare l'immagine e rilevare una particolare area dell'immagine tramite l'API C#?
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add an image to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source.png");
// Set document areas detection mode
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = Aspose.OCR.DetectAreasMode.DOCUMENT;
// Recognize image
List results = recognitionEngine.Recognize(input, recognitionSettings);
foreach(Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
Elabora immagini tramite API .NET
Aspose.OCR per .NET consente agli sviluppatori di software di eseguire diversi tipi di operazioni sulle immagini all'interno delle proprie applicazioni .NET. La libreria ha incluso diversi filtri di elaborazione delle immagini manuali e completamente automatizzati che aiutano gli utenti a migliorare le proprie immagini prima di eseguire le operazioni OCR, come correzione inclinazione, rotazione, rimozione rumore, correzione contrasto, ridimensionamento, binarizzazione, conversione in scala di grigi, inversione colore, dilatazione , Filtro mediano e molti altri. Sono disponibili molte altre opzioni e impostazioni che è possibile utilizzare per personalizzare il processo OCR. Per migliorare la qualità del riconoscimento delle immagini, gli sviluppatori possono applicare più filtri di elaborazione. Gli sviluppatori possono applicare facilmente numerosi filtri a regioni specifiche di un'immagine.
Applica filtri alle immagini utilizzando l'API C# .NET
Aspose.Drawing.Rectangle blackRectangle = new Aspose.Drawing.Rectangle(5, 161, 340, 113);
Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter filters = new Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter();
// (1) Invert black region
filters.Add(Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter.Invert(blackRectangle));
// (2) Denoise entire image
filters.Add(Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter.AutoDenoising());
Confronto di testi nelle immagini tramite API .NET
Aspose.OCR per .NET offre agli sviluppatori di software la capacità di confrontare il testo su due immagini all'interno delle proprie applicazioni C#. La libreria può confrontare i testi su due immagini, indipendentemente dal carattere, dalla dimensione del testo, dalle maiuscole, dagli stili e dai colori. Un modo per confrontare il testo delle immagini estraendo il testo dalle immagini e una volta estratto il testo dalle immagini, puoi utilizzare qualsiasi algoritmo di confronto del testo per confrontarli. Aspose.OCR per .NET fornisce un modo semplice per confrontare due stringhe utilizzando il metodo String.Equals. Nell'esempio seguente viene illustrato come confrontare il testo in due immagini utilizzando il codice C#.
Come confrontare il testo in due immagini utilizzando l'API .NET?
using System;
using Aspose.OCR;
using System.Drawing;
class Program
{
static void Main()
{
// Load the images
var image1 = Image.FromFile("image1.png");
var image2 = Image.FromFile("image2.png");
// Extract text from the images
var ocrEngine = new OcrEngine();
ocrEngine.Image = ImageStream.FromImage(image1);
ocrEngine.Process();
var text1 = ocrEngine.Text;
ocrEngine.Image = ImageStream.FromImage(image2);
ocrEngine.Process();
var text2 = ocrEngine.Text;
// Compare the extracted text
var areEqual = string.Equals(text1, text2, StringComparison.OrdinalIgnoreCase);
Console.WriteLine("Are the texts equal? " + areEqual);
}
}
//Note that the above code only works for exact text matches.
Cerca testo in un'immagine utilizzando l'API C#
Aspose.OCR per .NET rende facile per gli sviluppatori di software trovare il testo in un'immagine all'interno delle proprie applicazioni .NET. La libreria ha fornito supporto per la ricerca di testo nelle immagini con la stessa facilità con cui trovare il frammento di testo in una stringa. La libreria supporta la ricerca di una stringa con distinzione tra maiuscole e minuscole e senza distinzione tra maiuscole e minuscole e convalida persino il testo di un'immagine rispetto a un modello. Gli sviluppatori di software possono utilizzare il metodo ImageHasText per cercare testo all'interno di un'immagine con solo un paio di righe di codice C#. L'esempio seguente mostra come caricare un'immagine e cercare un particolare testo al suo interno.
Come trovare il testo in un'immagine tramite .NET?
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Ukr;
if(recognitionEngine.ImageHasText("source.png", "Aspose", recognitionSettings))
{
Console.WriteLine(@"The image contains the word ""Aspose""");
}
else
{
Console.WriteLine(@"The image doesn't contain the word ""Aspose""");
}