免费 Node.js API，为 JS 项目添加 OCR 功能。

开源 Node.js OCR 库，允许程序员免费识别并提取各种文件格式（包括图像（JPEG、PNG）、PDF 和文档）的文本，支持多语言。

Node-Tesseract-OCR 是什么？

在当今的数字时代，从图像和文档中提取文本已成为各行业的关键任务，包括文档管理、数据处理和人工智能等领域。光学字符识别（OCR）技术使得将扫描的文档、图像和 PDF 转换为可编辑的文本格式成为可能。Node-Tesseract-OCR 是一个开源 API，融合了 Tesseract OCR 引擎的强大功能，为在 Node.js 应用程序中执行 OCR 任务提供了无缝且高效的方式。

Node-Tesseract-OCR 是 Tesseract OCR 引擎的 Node.js 包装器，允许软件开发者在 Node.js 环境中利用 Tesseract 强大的文本识别功能。该 API 在此 GitHub 仓库维护，提供了一系列功能，适用于从简单文本提取到更复杂的文档处理任务的各种使用场景。软件开发者可以使用多语言从图像和文档中提取文本，使其成为多种应用的多功能工具。

Node-Tesseract-OCR API 提供了高级图像处理能力，包括图像过滤、调整大小和裁剪，以确保提取的文本准确可靠。它支持超过 100 种语言，成为在多样化环境中执行 OCR 任务的通用解决方案。软件开发者可以从图像、PDF 和文档中提取文本，并以 JSON、XML 或纯文本等多种格式返回。该 API 设计轻量、灵活且易于使用，是希望在项目中添加 OCR 功能的开发者的理想选择。凭借其先进的图像处理功能、语言支持和错误处理机制，它是开发者添加 OCR 功能的理想选择。

概览

Node-Tesseract-OCR 功能概览。

功能概览

执行 OCR
添加 OCR 功能
识别图像文本
转换文本图像
识别字体文本
搜索 PDF
超过 100 种语言
创建 OCR 应用
保存到浏览器
提取文本
多线程支持

Node-Tesseract-OCR

Node-Tesseract-OCR 支持以下流行的图像文件格式。

读取器

PNG, JPEG, BMP, TIFF, TGA, DICOM

写入器

PNG, JPEG, BMP, TIFF

Node-Tesseract-OCR

平台独立性

Node-Tesseract-OCR 可以与任何基于 Java 的编程语言一起使用

Java

Node-Tesseract-OCR

开始使用 Node-Tesseract-OCR

推荐的安装 Node-Tesseract-OCR 的方式是使用 npm。请使用以下命令进行顺利安装

通过 npm 安装 Node-Tesseract-OCR

npm install node-tesseract-ocr

您也可以手动安装；直接从 GitHub 仓库下载最新的发布文件。

在 Node.js API 中从图像提取文本

开源的 Node-Tesseract-OCR 库让软件开发者能够轻松创建能够在 Node.js 应用程序中自动从图像提取文本的应用。它支持从扫描文档、PDF、相机拍摄的照片或收据照片中提取文本。这对于创建可搜索的档案、自动化数据录入或在金融、医疗等行业处理大量文档非常有用。下面是一个简单示例，展示如何在 Node.js 应用程序中以编程方式从图像提取文本。

如何在 Node.js 环境中从图像提取文本？

const tesseract = require("node-tesseract-ocr");

tesseract.recognize("path/to/image.jpg")
  .then(text => {
    console.log("Recognized Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

在 Node.js 中的更好图像预处理

在应用 OCR 之前对图像进行预处理可以显著提升文本识别的准确性。开源的 Node-Tesseract-OCR 库支持基本的预处理技术，如调整大小、二值化和去倾斜。这些预处理步骤可以结合使用 sharp 或 jimp 等额外的 Node.js 库与 Node-Tesseract-OCR 实现。下面的示例展示了软件开发者如何使用预处理步骤来提升识别，尤其是对质量较低的图像。

如何通过 Node.js API 应用预处理步骤以提升识别？

const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");

sharp("path/to/input.jpg")
  .resize(800, 600) // Resize the image
  .greyscale() // Convert to greyscale
  .toBuffer()
  .then(data => {
    return tesseract.recognize(data, { lang: "eng" });
  })
  .then(text => {
    console.log("Preprocessed Image Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

多语言识别文本

Node-Tesseract-OCR 的一大亮点是其广泛的多语言支持。Tesseract OCR 库支持超过 100 种语言，使其成为需要处理多语言文档的应用的理想选择。软件开发者可以指定希望 Tesseract 使用的语言，从而提升非英文文本的识别准确性。下面的示例展示了软件开发者如何在 Node.js 应用程序中识别法语文本。

如何通过 JavaScript API 从图像中识别法语文本？

const config = {
  lang: "fra", // French language support
  oem: 1,
  psm: 3
};

tesseract.recognize("path/to/french-text-image.jpg", config)
  .then(text => {
    console.log("Recognized Text in French:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });