1. Productos
  2.   OCR
  3.   Node.js
  4.   Node-Tesseract-OCR
 
  

API Node.js gratuita para añadir capacidades OCR a proyectos JS.

Biblioteca OCR de Node.js de código abierto que permite a los programadores reconocer y extraer texto de varios formatos de archivo, incluidas imágenes (JPEG, PNG), PDFs y documentos de forma gratuita en varios idiomas.

¿Qué es Node-Tesseract-OCR?

En la era digital actual, extraer texto de imágenes y documentos se ha convertido en una tarea crucial en diversas industrias, incluidas la gestión documental, el procesamiento de datos y la inteligencia artificial. La tecnología de Reconocimiento Óptico de Caracteres (OCR) ha hecho posible convertir documentos escaneados, imágenes y PDFs en formatos de texto editables. Node-Tesseract-OCR es una API de código abierto que incorpora el poder del motor Tesseract OCR para proporcionar una forma fluida y eficiente de realizar tareas de OCR en aplicaciones Node.js.

Node-Tesseract-OCR es un contenedor de Node.js para el motor Tesseract OCR, que permite a los desarrolladores de software utilizar las potentes funciones de reconocimiento de texto de Tesseract dentro de un entorno Node.js. La API se mantiene en este repositorio de GitHub y ofrece una gama de funcionalidades que la hacen adecuada para varios casos de uso, desde la extracción simple de texto hasta tareas más complejas de procesamiento de documentos. Los desarrolladores pueden extraer texto de imágenes y documentos en múltiples idiomas, lo que la convierte en una herramienta versátil para diversas aplicaciones.

La API Node-Tesseract-OCR proporciona capacidades avanzadas de procesamiento de imágenes, incluyendo filtrado, redimensionado y recorte, para garantizar que el texto extraído sea preciso y fiable. Soporta más de 100 idiomas, lo que la convierte en una solución versátil para tareas de OCR en entornos diversos. Los desarrolladores pueden extraer texto de imágenes, PDFs y documentos, y devolver el texto extraído en una variedad de formatos, como JSON, XML y texto plano. Está diseñada para ser ligera, flexible y fácil de usar, lo que la hace una opción ideal para los desarrolladores que desean añadir capacidades OCR a sus proyectos. Con sus avanzadas capacidades de procesamiento de imágenes, soporte multilingüe y mecanismos de manejo de errores, es una elección ideal para los desarrolladores que quieren añadir OCR a sus proyectos.

Previous Next

Comenzando con Node-Tesseract-OCR

La forma recomendada de instalar Node-Tesseract-OCR es usando npm. Por favor, use el siguiente comando para una instalación sin problemas

Instalar Node-Tesseract-OCR vía npm

npm install node-tesseract-ocr 

También puede instalarlo manualmente; descargue los archivos de la última versión directamente del repositorio de GitHub .

Extracción de texto de imágenes en la API Node.js

La biblioteca de código abierto Node-Tesseract-OCR facilita a los desarrolladores de software crear aplicaciones que extraen automáticamente texto de imágenes dentro de aplicaciones Node.js. Soporta la extracción de texto de documentos escaneados, PDFs, fotos de cámara o fotos de recibos. Esto puede ser útil para crear archivos archivables, automatizar la entrada de datos o procesar grandes volúmenes de documentos en sectores como finanzas y salud. Aquí hay un ejemplo sencillo que muestra cómo extraer texto de imágenes dentro de aplicaciones Node.js.

¿Cómo extraer texto de imágenes dentro del entorno Node.js?

const tesseract = require("node-tesseract-ocr");

tesseract.recognize("path/to/image.jpg")
  .then(text => {
    console.log("Recognized Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Mejor preprocesamiento de imágenes dentro de Node.js

Preprocesar imágenes antes de aplicar OCR puede mejorar significativamente la precisión del reconocimiento de texto. La biblioteca de código abierto Node-Tesseract-OCR permite técnicas básicas de preprocesamiento, como redimensionado, binarización y corrección de inclinación. Estos pasos pueden implementarse usando bibliotecas Node.js adicionales como sharp o jimp en conjunto con Node-Tesseract-OCR. El siguiente ejemplo muestra cómo los desarrolladores usan pasos de preprocesamiento para mejorar el reconocimiento, especialmente con imágenes de baja calidad.

¿Cómo aplicar pasos de preprocesamiento para mejorar el reconocimiento mediante la API Node.js?

const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");

sharp("path/to/input.jpg")
  .resize(800, 600) // Resize the image
  .greyscale() // Convert to greyscale
  .toBuffer()
  .then(data => {
    return tesseract.recognize(data, { lang: "eng" });
  })
  .then(text => {
    console.log("Preprocessed Image Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Texto reconocido en varios idiomas

Una de las características más destacadas de Node-Tesseract-OCR es su amplio soporte multilingüe. La biblioteca Tesseract OCR soporta más de 100 idiomas, lo que la convierte en una opción ideal para aplicaciones que necesitan procesar documentos en varios idiomas. Los desarrolladores pueden especificar el/los idioma(s) que desean que Tesseract use, mejorando la precisión del reconocimiento para textos no ingleses. Aquí hay un ejemplo que muestra cómo los desarrolladores pueden reconocer texto en francés dentro de aplicaciones Node.js?

¿Cómo reconocer texto de una imagen en francés mediante la API JavaScript?

const config = {
  lang: "fra", // French language support
  oem: 1,
  psm: 3
};

tesseract.recognize("path/to/french-text-image.jpg", config)
  .then(text => {
    console.log("Recognized Text in French:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

 Español