
Bibliothèque Aspose.OCR pour Node.js via C++
Bibliothèque OCR Node.js pour Reconnaître/Extraire le Texte des Images
L'API OCR Node.js permet aux développeurs de logiciels d'extraire du texte à partir d'images, de documents numérisés, de photos et de captures d'écran, ainsi que d'automatiser les tâches impliquant la reconnaissance de texte.
Bibliothèque Aspose.OCR pour Node.js via C++ est une bibliothèque puissante qui fournit des capacités de reconnaissance optique de caractères (OCR) aux développeurs travaillant avec des applications Node.js. Cette bibliothèque fait partie de la suite Aspose, reconnue pour ses solutions de traitement de documents robustes et fiables. Sa fonctionnalité principale est sa capacité à reconnaître et extraire du texte à partir d'images, de documents numérisés, de photos, de captures d'écran, etc. La bibliothèque peut également reconnaître le texte manuscrit en plus du texte imprimé, élargissant ainsi son utilisabilité à un plus grand nombre de documents. En plus d'extraire du texte brut, elle peut également préserver le formatage du texte reconnu, y compris les styles de police, les tailles et les couleurs.
L'une des caractéristiques remarquables de la bibliothèque Aspose.OCR pour Node.js est son support de multiples formats d'image, notamment JPEG, PNG, BMP, TIFF et bien d'autres. Cette polyvalence permet aux développeurs de travailler avec une large gamme d'images, facilitant le traitement de divers types de documents et de graphiques. De plus, elle offre des algorithmes OCR avancés qui garantissent une extraction de texte précise et fiable. En tirant parti de techniques de reconnaissance sophistiquées, la bibliothèque peut interpréter efficacement le texte des images, même lorsque le texte est incliné, flou ou déformé.
Aspose.OCR pour Node.js prend en charge de nombreuses langues, ce qui la rend adaptée aux applications mondiales. Elle peut reconnaître le texte dans plus de 130 langues, dont l'anglais, l'espagnol, le français, l'allemand, l'italien, le portugais, le chinois, le japonais et bien d'autres. Conçue pour la performance et l'évolutivité, la bibliothèque peut gérer de gros volumes d'images de manière efficace. Elle permet aux développeurs de définir des modèles personnalisés pour les documents structurés. Cette fonctionnalité est utile pour extraire des champs spécifiques de formulaires, factures et autres documents à modèle. Dans l'ensemble, la bibliothèque Aspose.OCR est un outil précieux pour les développeurs souhaitant intégrer des fonctionnalités OCR dans leurs applications Node.js.
Commencer avec la bibliothèque Aspose.OCR pour Node.js via C++
La méthode recommandée pour installer la bibliothèque Aspose.OCR pour Node.js via C++ est d'utiliser npm. Veuillez utiliser la commande suivante pour une installation fluide.
Installer la bibliothèque Aspose.OCR pour Node.js via C++ avec npm
npm install aspose-ocr-cloud Vous pouvez télécharger la bibliothèque directement depuis la page produit Aspose.OCR
La bibliothèque Aspose.OCR pour Node.js via C++ offre une fonctionnalité complète pour effectuer des opérations de reconnaissance optique de caractères (OCR) sur diverses images. En quelques lignes de code, les développeurs peuvent reconnaître et extraire du texte d'images au sein d'applications Node.js. L'API prend en charge divers formats d'image populaires, tels que JPEG, PNG, GIF, TIFF, PDF, BMP, et bien d'autres. Plusieurs fonctionnalités importantes font partie de la bibliothèque, comme la reconnaissance d'images tournées, inclinées et bruitées. De plus, les développeurs peuvent enregistrer les résultats de reconnaissance dans les formats de documents et d'échange de données les plus populaires. L'exemple suivant montre comment des commandes JavaScript peuvent être utilisées pour charger et extraire du texte d'une image.Comment reconnaître du texte à partir d'une image dans les applications Node.js ?
let source = Module.WasmAsposeOCRInput();
source.url = internalFileName;
let batch = new Module.WasmAsposeOCRInputs();
batch.push_back(source);
// Send image for OCR
var result = Module.AsposeOCRRecognize(batch);
// Output extracted text to the console
var text = Module.AsposeOCRSerializeResult(
result, Module.ExportFormat.text);
console.log(text);
Reconnaissance du texte manuscrit dans les applications Node.js
Comment reconnaître du texte à partir d'une image dans les applications Node.js ?
let source = Module.WasmAsposeOCRInput();
source.url = internalFileName;
let batch = new Module.WasmAsposeOCRInputs();
batch.push_back(source);
// Send image for OCR
var result = Module.AsposeOCRRecognize(batch);
// Output extracted text to the console
var text = Module.AsposeOCRSerializeResult(
result, Module.ExportFormat.text);
console.log(text);
La bibliothèque Aspose.OCR pour Node.js via C++ facilite la reconnaissance du texte manuscrit dans vos propres applications Node.js. Elle peut reconnaître le texte manuscrit en plus du texte imprimé, élargissant ainsi son utilisabilité à un plus grand nombre de documents. Les développeurs peuvent activer le mode texte manuscrit pour reconnaître ce type de texte. Il est également possible de reconnaître une image depuis une URL sans la télécharger localement. L'exemple suivant montre comment les développeurs peuvent charger et reconnaître du texte manuscrit dans les applications node.js.
Comment reconnaître du texte manuscrit dans les applications Node.js
const recognizeHandwritten = true;
ocrApi.recognizeFromContent('eng', recognizeHandwritten, imageBuffer, (error, data) => {
if (error) throw error;
console.log('Extracted Handwritten Text:', data.text);
});
Support de la reconnaissance basée sur les modèles
La reconnaissance basée sur les modèles consiste à définir un modèle qui spécifie la mise en page et les zones d'intérêt d'un document. La reconnaissance basée sur les modèles avec Aspose.OCR pour Node.js via C++ offre une méthode structurée et précise pour extraire des données de documents à mise en page fixe. Cette fonctionnalité est utile pour extraire des champs spécifiques de formulaires, factures et autres documents à modèle. Voici un exemple très utile montrant comment les développeurs peuvent charger le modèle et l'appliquer à une image pour l'OCR dans les applications Node.js.
Comment charger le modèle et l'appliquer à une image pour l'OCR dans les applications Node.js ?
const fs = require('fs');
const { OcrApi, AsposeApp, TemplateApi } = require('aspose-ocr-cloud');
const appSid = 'your-app-sid';
const appKey = 'your-app-key';
AsposeApp.appSID = appSid;
AsposeApp.appKey = appKey;
const ocrApi = new OcrApi();
const templateApi = new TemplateApi();
const imagePath = 'path/to/your/invoice.jpg';
const templatePath = 'path/to/your/template.json';
fs.readFile(imagePath, (err, imageBuffer) => {
if (err) throw err;
fs.readFile(templatePath, (err, templateBuffer) => {
if (err) throw err;
// Load the template
templateApi.addTemplate(templateBuffer, (error, templateId) => {
if (error) throw error;
// Apply the template to the image
ocrApi.recognizeFromTemplate(imageBuffer, templateId, (error, result) => {
if (error) throw error;
console.log('Extracted Data:', result.fields);
});
});
});
});
Préserver le formatage du texte dans les opérations OCR
Préserver le formatage du texte lors des opérations OCR est crucial pour les applications où la structure, les styles de police et la mise en page du texte sont importants. En plus d'extraire du texte brut, Aspose.OCR pour Node.js via C++ peut également préserver le formatage du texte reconnu, y compris les styles de police, les tailles et les couleurs. Cela est particulièrement utile pour le traitement de documents où le formatage du texte est essentiel. Ci‑dessous un exemple démontrant comment les développeurs peuvent préserver le formatage du texte à l'aide de l'API Aspose.OCR.
Comment préserver le formatage du texte dans les opérations OCR au sein des applications Node.js ?
const fs = require('fs');
const { OcrApi, AsposeApp, OCRFormat, OCRRecognitionSettings } = require('aspose-ocr-cloud');
const appSid = 'your-app-sid';
const appKey = 'your-app-key';
AsposeApp.appSID = appSid;
AsposeApp.appKey = appKey;
const ocrApi = new OcrApi();
const imagePath = 'path/to/your/document.jpg';
fs.readFile(imagePath, (err, imageBuffer) => {
if (err) throw err;
const recognitionSettings = new OCRRecognitionSettings();
recognitionSettings.setDetectAreas(true);
recognitionSettings.setDetectText(true);
recognitionSettings.setDetectItalic(true);
recognitionSettings.setDetectBold(true);
ocrApi.recognizeWithSettings(imageBuffer, OCRFormat.TEXT, recognitionSettings, (error, data) => {
if (error) throw error;
const formattedText = data.text;
const formattingDetails = data.textAreas;
console.log('Extracted Text with Formatting:', formattedText);
console.log('Formatting Details:', formattingDetails);
});
});
