API JavaScript de código aberto para adicionar e gerenciar OCR em aplicativos da web

Uma biblioteca JavaScript gratuita líder para adicionar funcionalidade de reconhecimento óptico de caracteres (OCR) a aplicativos da Web JS e transformar imagens de texto impresso ou manuscrito em texto legível por máquina gratuitamente.

Tesseract.js é uma biblioteca JavaScript de código aberto muito útil que permite aos desenvolvedores de software integrar a funcionalidade de reconhecimento óptico de caracteres (OCR) em seus aplicativos da web com o mínimo de esforço e custo. OCR é o processo de conversão de imagens de texto impresso ou manuscrito em texto legível por máquina. Tesseract.js é uma versão do popular mecanismo Tesseract OCR, que foi originalmente desenvolvido pela Hewlett-Packard na década de 1980 e posteriormente mantido pelo Google. Tesseract.js pode reconhecer mais de 100 idiomas, o que o torna uma ferramenta poderosa para desenvolvedores que desejam adicionar funcionalidade de OCR a seus aplicativos da web.

Tesseract.js é muito fácil de manusear e pode ser usado para diversas tarefas, como extrair texto de documentos digitalizados, recibos e cartões de visita, automatizar tarefas de entrada de dados e aprimorar a funcionalidade de pesquisa em aplicativos da web. Uma das principais vantagens do Tesseract.js é a capacidade de reconhecer texto mesmo quando a imagem de entrada é de baixa qualidade ou resolução. A biblioteca usa algoritmos de aprendizado de máquina para melhorar a precisão dos resultados de OCR. Ele também pode realizar análises de layout de página e detectar regiões de interesse em uma imagem.

Tesseract.js está se tornando popular devido à sua facilidade de uso, bem como aos poderosos recursos de OCR e pode ser executado sem problemas em um navegador ou em um servidor com NodeJS. Ele fornece uma API simples que permite aos desenvolvedores de software configurar opções de OCR, como idioma, modo de segmentação de página e caracteres da lista de permissões. Sua capacidade de reconhecer texto de imagens de baixa qualidade e suporte para vários idiomas o tornam uma ferramenta valiosa para uma ampla variedade de aplicativos e uma excelente opção para desenvolvedores que desejam adicionar OCR aos seus aplicativos da Web.

Resumo

Uma visão geral dos recursos do Tesseract.js.

Visão geral dos recursos

Executar OCR
Adicionar recursos de OCR
Reconhecer o texto da imagem
Converta imagens de texto
Texto de fonte reconhecida
Pesquisar PDF
Mais de 100 idiomas
Criar aplicativos de OCR
Salvar no navegador
Extrair texto
Suporte multithreading

Tesseract.js

Tesseract.js é compatível com formatos de arquivo de imagem populares listados abaixo.

Leitor

PNG, JPEG, BMP, TIFF, TGA, DICOM

Escritor

PNG, JPEG, BMP, TIFF

Tesseract.js

Independência de plataforma

Tesseract.js pode funcionar com qualquer linguagem de programação baseada em Java

Java

Tesseract.js

Introdução ao Tesseract.js

A maneira recomendada de instalar o Tesseract.js é usando npm. Use o seguinte comando para uma instalação tranquila

Instalar Tesseract.js via npm

 npm install tesseract.js

Você também pode instalá-lo manualmente; baixe os arquivos da versão mais recente diretamente do repositório GitHub.

Converter imagem em texto via API JavaScript

A biblioteca JavaScript de código aberto Tesseract.js torna mais fácil para os desenvolvedores de software trabalharem com vários tipos de imagens, como BMP, JPG, PNG, PBM, WebP e muito mais. A biblioteca oferece suporte à extração de texto de imagens para automatizar o processamento de textos em imagens, PDFs e documentos digitalizados. O exemplo a seguir mostra como carregar uma imagem e extrair o texto dela com apenas algumas linhas de código. O argumento da linguagem é usado para determinar os dados da linguagem treinada a serem usados no processamento de imagens. Os desenvolvedores de software podem usar vários idiomas aqui.

Como converter imagem em texto usando API JavaScript?

Tesseract.recognize(
  image,language,
  { 
    logger: m => console.log(m) 
  }
)
.catch (err => {
  console.error(err);
})
.then(result => {
 console.log(result);
})
}

Ler uma região de imagem e extrair texto via JS API

A biblioteca JavaScript de código aberto inclui recursos muito úteis para ler uma área específica dentro de uma imagem e capturar seus dados dentro de aplicativos JavaScript. A API suporta a captura da área da imagem e tenta reconhecer o texto dentro desta região usando o poderoso mecanismo interno de OCR. Os exemplos a seguir mostram como os desenvolvedores de software podem fornecer URL para a imagem e a API pode detectar e reconhecer facilmente o texto na área selecionada.

Ler e reconhecer texto em uma região selecionada de uma imagem por meio da API JS

const { createWorker } = require('tesseract.js');

const worker = await createWorker();
const rectangle = { left: 0, top: 0, width: 500, height: 250 };

(async () => {
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png', { rectangle });
  console.log(text);
  await worker.terminate();
})();