API JavaScript Open Source pour ajouter et gérer l'OCR aux applications Web

Une bibliothèque JavaScript gratuite de premier plan pour ajouter une fonctionnalité de reconnaissance optique de caractères (OCR) aux applications Web JS et transformer gratuitement des images de texte imprimé ou manuscrit en texte lisible par machine.

Tesseract.js est une bibliothèque JavaScript open source très utile qui permet aux développeurs de logiciels d'intégrer la fonctionnalité de reconnaissance optique de caractères (OCR) dans leurs applications Web avec un minimum d'effort et de coût. L'OCR est le processus de conversion d'images de texte imprimé ou manuscrit en texte lisible par machine. Tesseract.js est un portage du populaire moteur OCR Tesseract, initialement développé par Hewlett-Packard dans les années 1980, puis maintenu par Google. Tesseract.js peut reconnaître plus de 100 langues, ce qui en fait un outil puissant pour les développeurs cherchant à ajouter des fonctionnalités OCR à leurs applications Web.

Tesseract.js est très simple à gérer et peut être utilisé pour diverses tâches, telles que l'extraction de texte à partir de documents numérisés, de reçus et de cartes de visite, l'automatisation des tâches de saisie de données ainsi que l'amélioration des fonctionnalités de recherche dans les applications Web. L'un des principaux avantages de Tesseract.js est sa capacité à reconnaître le texte même lorsque l'image d'entrée est de mauvaise qualité ou de mauvaise résolution. La bibliothèque utilise des algorithmes d'apprentissage automatique pour améliorer la précision des résultats OCR. Il peut également effectuer une analyse de la mise en page et détecter les régions d’intérêt au sein d’une image.

Tesseract.js devient populaire en raison de sa facilité d'utilisation ainsi que de ses puissantes capacités OCR et peut être exécuté facilement dans un navigateur ou sur un serveur avec NodeJS. Il fournit une API simple qui permet aux développeurs de logiciels de configurer les options OCR telles que la langue, le mode de segmentation des pages et les caractères de la liste blanche. Sa capacité à reconnaître le texte d'images de mauvaise qualité et sa prise en charge de plusieurs langues en font un outil précieux pour un large éventail d'applications et un excellent choix pour les développeurs cherchant à ajouter l'OCR à leurs applications Web.

En un coup d'œil

Un aperçu des fonctionnalités de Tesseract.js.

Aperçu des fonctionnalités

Effectuer l'OCR
Ajouter des fonctionnalités OCR
Reconnaître le texte de l'image
Convertir des images de texte
Texte de police reconnu
Rechercher un PDF
Plus de 100 langues
Créer des applications OCR
Enregistrer dans le navigateur
Extraire le texte
Support multithread

Tesseract.js

Tesseract.js prend en charge les formats de fichiers image populaires répertoriés ci-dessous.

Lecteur

PNG, JPEG, BMP, TIFF, TGA, DICOM

Écrivain

PNG, JPEG, BMP, TIFF

Tesseract.js

Indépendance de la plateforme

Tesseract.js peut fonctionner avec n'importe quel langage de programmation basé sur Java

Java

Tesseract.js

Premiers pas avec Tesseract.js

La méthode recommandée pour installer Tesseract.js consiste à utiliser npm. Veuillez utiliser la commande suivante pour une installation fluide

Installer Tesseract.js via npm

 npm install tesseract.js

Vous pouvez également l'installer manuellement ; téléchargez les fichiers de la dernière version directement à partir du référentiel GitHub.

Convertir une image en texte via l'API JavaScript

La bibliothèque JavaScript open source Tesseract.js permet aux développeurs de logiciels de travailler facilement avec différents types d'images telles que BMP, JPG, PNG, PBM, WebP et bien d'autres encore. La bibliothèque prend en charge l'extraction de texte à partir d'images pour automatiser le traitement des textes sur les images, les PDF et les documents numérisés. L'exemple suivant montre comment charger une image et en extraire du texte avec seulement quelques lignes de code. L'argument langage est utilisé pour déterminer les données linguistiques entraînées à utiliser dans le traitement des images. Les développeurs de logiciels peuvent utiliser plusieurs langues ici.

Comment convertir une image en texte à l'aide de l'API JavaScript ?

Tesseract.recognize(
  image,language,
  { 
    logger: m => console.log(m) 
  }
)
.catch (err => {
  console.error(err);
})
.then(result => {
 console.log(result);
})
}

Lire une région d'image et extraire le texte via l'API JS

La bibliothèque JavaScript open source inclut des fonctionnalités très utiles pour lire une zone particulière à l'intérieur d'une image et capturer ses données dans des applications JavaScript. L'API prend en charge la capture de la zone de l'image et tente de reconnaître le texte à l'intérieur de cette région à l'aide du puissant moteur OCR interne. Les exemples suivants montrent comment les développeurs de logiciels peuvent fournir l'URL de l'image et comment l'API peut facilement détecter et reconnaître le texte dans la zone sélectionnée.

Lire et reconnaître le texte dans une région sélectionnée d'une image via l'API JS

const { createWorker } = require('tesseract.js');

const worker = await createWorker();
const rectangle = { left: 0, top: 0, width: 500, height: 250 };

(async () => {
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png', { rectangle });
  console.log(text);
  await worker.terminate();
})();