1. Productos
  2.   OCR
  3.   .NET
  4.   Aspose.OCR for .NET

Aspose.OCR for .NET

 
 

API .NET OCR líder para operaciones de reconocimiento óptico de caracteres

API .NET superior para agregar funcionalidad de reconocimiento óptico de caracteres (OCR) dentro de aplicaciones C#. Permite convertir texto impreso o escrito a mano a formato digital.

El reconocimiento óptico de caracteres (OCR) es un proceso muy útil para transformar imágenes de texto y documentos impresos a un formato de texto legible por máquina. Aspose.OCR para .NET es una biblioteca de OCR avanzada que facilita a los desarrolladores de software convertir documentos o texto impresos y escritos a mano a formato digital, lo que facilita su búsqueda, edición y compartir con otros usuarios. La biblioteca C# .NET ha incluido un potente lector de imágenes que puede leer varios formatos de archivos de imágenes populares, como JPEG, PNG, TIFF, GIF, imágenes BMP, documentos PDF, TIFF, DjVu y muchos más. Los desarrolladores de software también pueden almacenar los resultados del reconocimiento en el formato de intercambio de datos y documentos más popular.

Aspose.OCR para .NET es una de las bibliotecas de OCR líderes en el mercado que permite a los desarrolladores de software agregar funcionalidad de OCR a sus aplicaciones .NET sin dependencias externas. La biblioteca utiliza algoritmos avanzados para reconocer texto de documentos escaneados, imágenes, texto escrito a mano, fotografías de teléfonos inteligentes, capturas de pantalla, áreas específicas de imágenes y otras fuentes y luego lo convierte en texto editable con facilidad. Admite más de 26 idiomas, incluidos inglés, chino, coreano, español, francés, alemán, italiano, búlgaro, kazajo, ruso, japonés y árabe.

Aspose.OCR para .NET es muy estable y ha incluido una función muy útil para el reconocimiento de códigos de barras que permite a los desarrolladores de software reconocer formatos de códigos de barras populares, como códigos QR y códigos UPC. La biblioteca ha incluido algunos potentes filtros de preprocesamiento que permiten a los programadores reconocer imágenes rotadas, sesgadas y ruidosas con solo un par de líneas de código C#. Además, se puede integrar fácilmente con otras bibliotecas de Aspose, como Aspose.PDF y Aspose.Words, lo que permite a los desarrolladores crear potentes flujos de trabajo de procesamiento de documentos. También es muy fácil reconocer imágenes proporcionadas como enlaces web y realizar un reconocimiento por lotes de todas las imágenes en una carpeta o archivo.

Previous Next

Introducción a Aspose.OCR para .NET

La forma recomendada de instalar Aspose.OCR para .NET es utilizar NuGet. Utilice el siguiente comando para una instalación sin problemas.

Instalar Aspose.Pdf mediante el comando NuGet

 Install-Package Aspose.OCR

Puedes descargar la biblioteca directamente desde la Aspose.PDF página del producto

Detectar un área particular de una imagen mediante C#

Aspose.OCR para .NET ha proporcionado la capacidad de detectar un área particular en la imagen dentro de aplicaciones .NET. Una imagen o fotografía de texto escaneada puede abarcar párrafos de texto, tablas, ilustraciones, fórmulas y más. Detectar, ordenar y clasificar áreas de interés en una página es la piedra angular de un OCR exitoso y preciso. Para lograr la tarea, hay varios algoritmos de detección de áreas de documentos que forman parte de la biblioteca que ayudan a los desarrolladores de software a detectar un tipo particular de contenido. A continuación se muestra cómo cargar una imagen y detectar un área particular para el reconocimiento de texto usando comandos de C#.

¿Cómo cargar una imagen y detectar un área de imagen particular a través de la API de C#?

Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add an image to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source.png");
// Set document areas detection mode
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = Aspose.OCR.DetectAreasMode.DOCUMENT;
// Recognize image
List results = recognitionEngine.Recognize(input, recognitionSettings);
foreach(Aspose.OCR.RecognitionResult result in results)
{
	Console.WriteLine(result.RecognitionText);
}

Procesar imágenes mediante .NET API

Aspose.OCR para .NET permite a los desarrolladores de software realizar diferentes tipos de operaciones en imágenes dentro de sus propias aplicaciones .NET. La biblioteca ha incluido varios filtros de procesamiento de imágenes manuales y totalmente automatizados que ayudan a los usuarios a mejorar sus imágenes antes de realizar las operaciones de OCR, como corrección de inclinación, rotación, eliminación de ruido, corrección de contraste, cambio de tamaño, binarización, conversión a escala de grises, inversión de color, dilatación. , Filtro mediano y muchos más. Hay muchas otras opciones y configuraciones que puede utilizar para personalizar el proceso de OCR. Para mejorar la calidad del reconocimiento de imágenes, los desarrolladores pueden aplicar múltiples filtros de procesamiento. Los desarrolladores pueden aplicar fácilmente numerosos filtros a regiones específicas de una imagen.

Aplicar filtros en imágenes usando C# .NET API

Aspose.Drawing.Rectangle blackRectangle = new Aspose.Drawing.Rectangle(5, 161, 340, 113);
Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter filters = new Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter();
// (1) Invert black region
filters.Add(Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter.Invert(blackRectangle));
// (2) Denoise entire image
filters.Add(Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter.AutoDenoising());

Comparación de texto en imágenes mediante .NET API

Aspose.OCR para .NET ofrece a los desarrolladores de software la capacidad de comparar texto en dos imágenes dentro de sus propias aplicaciones C#. La biblioteca puede comparar textos en dos imágenes, independientemente de la fuente, el tamaño del texto, las mayúsculas y minúsculas, los estilos y los colores. Una forma de comparar texto de imágenes extrae texto de las imágenes y una vez que haya extraído el texto de las imágenes, puede usar cualquier algoritmo de comparación de texto para compararlos. Aspose.OCR para .NET proporciona una forma sencilla de comparar dos cadenas utilizando el método String.Equals. El siguiente ejemplo demuestra cómo comparar texto en dos imágenes usando código C#.

¿Cómo comparar texto en dos imágenes usando .NET API?

 
using System;
using Aspose.OCR;
using System.Drawing;
 
class Program
{
    static void Main()
    {
        // Load the images
        var image1 = Image.FromFile("image1.png");
        var image2 = Image.FromFile("image2.png");
 
        // Extract text from the images
        var ocrEngine = new OcrEngine();
        ocrEngine.Image = ImageStream.FromImage(image1);
        ocrEngine.Process();
        var text1 = ocrEngine.Text;
 
        ocrEngine.Image = ImageStream.FromImage(image2);
        ocrEngine.Process();
        var text2 = ocrEngine.Text;
 
        // Compare the extracted text
        var areEqual = string.Equals(text1, text2, StringComparison.OrdinalIgnoreCase);
        Console.WriteLine("Are the texts equal? " + areEqual);
    }
}
//Note that the above code only works for exact text matches. 

Buscar texto en una imagen usando la API de C#

Aspose.OCR para .NET facilita a los desarrolladores de software encontrar texto en una imagen dentro de sus propias aplicaciones .NET. La biblioteca ha brindado soporte para buscar texto en imágenes tan fácil como encontrar el fragmento de texto en una cadena. La biblioteca admite la búsqueda de una cadena que distinga entre mayúsculas y minúsculas o no, e incluso valida el texto de una imagen con respecto a un patrón. Los desarrolladores de software pueden utilizar el método ImageHasText para buscar texto dentro de una imagen con sólo un par de líneas de código C#. El siguiente ejemplo muestra cómo cargar una imagen y buscar un texto particular dentro de ella.

¿Cómo encontrar texto en una imagen a través de .NET?

Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Ukr;
if(recognitionEngine.ImageHasText("source.png", "Aspose", recognitionSettings))
{
	Console.WriteLine(@"The image contains the word ""Aspose""");
}
else
{
	Console.WriteLine(@"The image doesn't contain the word ""Aspose""");
}

 Español