1. Товары
  2.   OCR
  3.   JavaScript
  4.   Tesseract.js
 
  

API JavaScript с открытым исходным кодом для добавления и управления распознаванием текста в веб-приложениях

Ведущая бесплатная библиотека JavaScript для добавления функции оптического распознавания символов (OCR) в веб-приложения JS и бесплатного преобразования изображений печатного или рукописного текста в машиночитаемый текст.

Tesseract.js — это очень полезная библиотека JavaScript с открытым исходным кодом, которая позволяет разработчикам программного обеспечения интегрировать функцию оптического распознавания символов (OCR) в свои веб-приложения с минимальными усилиями и затратами. OCR — это процесс преобразования изображений печатного или рукописного текста в машиночитаемый текст. Tesseract.js — это порт популярного механизма оптического распознавания символов Tesseract, который первоначально был разработан Hewlett-Packard в 1980-х годах, а затем поддерживается Google. Tesseract.js распознает более 100 языков, что делает его мощным инструментом для разработчиков, желающих добавить функцию распознавания текста в свои веб-приложения.

Tesseract.js очень прост в использовании и может использоваться для различных задач, таких как извлечение текста из отсканированных документов, квитанций и визитных карточек, автоматизация задач по вводу данных, а также расширение функций поиска в веб-приложениях. Одним из ключевых преимуществ Tesseract.js является его способность распознавать текст, даже если входное изображение имеет низкое качество или разрешение. Библиотека использует алгоритмы машинного обучения для повышения точности результатов оптического распознавания символов. Он также может выполнять анализ макета страницы и обнаруживать интересующие области внутри изображения.

Tesseract.js становится популярным благодаря простоте использования, а также мощным возможностям распознавания текста. Его можно легко запускать как в браузере, так и на сервере с NodeJS. Он предоставляет простой API, который позволяет разработчикам программного обеспечения настраивать параметры оптического распознавания символов, такие как язык, режим сегментации страниц и символы белого списка. Его способность распознавать текст на изображениях низкого качества и поддержка нескольких языков делают его ценным инструментом для широкого спектра приложений и отличным выбором для разработчиков, желающих добавить OCR в свои веб-приложения.

Previous Next

Начало работы с Tesseract.js

Рекомендуемый способ установки Tesseract.js — использование npm. Пожалуйста, используйте следующую команду для беспрепятственной установки

Установите Tesseract.js через npm

 npm install tesseract.js

Вы также можете установить его вручную; загрузите файлы последней версии непосредственно из репозитория GitHub.

Преобразование изображения в текст с помощью JavaScript API

Библиотека JavaScript с открытым исходным кодом Tesseract.js упрощает разработчикам программного обеспечения работу с различными типами изображений, такими как BMP, JPG, PNG, PBM, WebP и другими. Библиотека поддерживает извлечение текста из изображений для автоматизации обработки текста на изображениях, PDF-файлах и отсканированных документах. В следующем примере показано, как загрузить изображение и извлечь из него текст с помощью всего лишь пары строк кода. Аргумент языка используется для определения обученных языковых данных, которые будут использоваться при обработке изображений. Разработчики программного обеспечения могут использовать здесь несколько языков.

Как преобразовать изображение в текст с помощью JavaScript API?

Tesseract.recognize(
  image,language,
  { 
    logger: m => console.log(m) 
  }
)
.catch (err => {
  console.error(err);
})
.then(result => {
 console.log(result);
})
}

Чтение области изображения и извлечение текста через JS API

Библиотека JavaScript с открытым исходным кодом включает в себя очень полезные функции для чтения определенной области внутри изображения и захвата ее данных внутри приложений JavaScript. API поддерживает захват области изображения и пытается распознать текст внутри этой области, используя внутренний мощный механизм оптического распознавания символов. В следующих примерах показано, как разработчики программного обеспечения могут предоставить URL-адрес изображения, а API может легко обнаружить и распознать текст в выбранной области.

Чтение и распознавание текста в выбранной области изображения с помощью JS API

const { createWorker } = require('tesseract.js');

const worker = await createWorker();
const rectangle = { left: 0, top: 0, width: 500, height: 250 };

(async () => {
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png', { rectangle });
  console.log(text);
  await worker.terminate();
})();
 Русский