
Aspose.OCR library for Node.js via C++
Node.js OCR-bibliotek til at genkende/udtrække billedets tekst
Node.js OCR API gør det muligt for softwareudviklere at udtrække tekst fra billeder, scannede dokumenter, fotos og skærmbilleder samt automatisere opgaver, der involverer tekstgenkendelse.
Aspose.OCR library for Node.js via C++ er et kraftfuldt bibliotek, der leverer optisk tegngenkendelse (OCR) funktioner til softwareudviklere, der arbejder med Node.js‑applikationer. Dette bibliotek er en del af Aspose‑suite, som er kendt for sine robuste og pålidelige dokumentbehandlingsløsninger. Hovedfunktionen er evnen til at genkende og udtrække tekst fra billeder, scannede dokumenter, fotos, skærmbilleder osv. Biblioteket kan også genkende håndskrevet tekst ud over trykt tekst, hvilket udvider dets anvendelighed til et bredere udvalg af dokumenter. Ud over at udtrække ren tekst kan det også bevare formateringen af den genkendte tekst, herunder skrifttype, størrelse og farver.
En af de fremtrædende funktioner i Aspose.OCR for Node.js-biblioteket er understøttelsen af flere billedformater, herunder JPEG, PNG, BMP, TIFF og mange flere. Denne alsidighed gør det muligt for softwareudviklere at arbejde med et bredt udvalg af billeder, hvilket gør det lettere at behandle forskellige typer af dokumenter og grafik. Desuden tilbyder det avancerede OCR‑algoritmer, der sikrer præcis og pålidelig tekstudtrækning. Ved at udnytte sofistikerede genkendelsesteknikker kan biblioteket effektivt fortolke tekst fra billeder, selv i tilfælde hvor teksten er skæv, sløret eller forvrænget.
Aspose.OCR for Node.js understøtter flere sprog, hvilket gør det egnet til globale applikationer. Det kan genkende tekst på mere end 130 sprog, herunder engelsk, spansk, fransk, tysk, italiensk, portugisisk, kinesisk, japansk og mange andre. Designet med fokus på ydeevne og skalerbarhed kan biblioteket håndtere store mængder billeder effektivt. Det giver udviklere mulighed for at definere brugerdefinerede skabeloner til strukturerede dokumenter. Denne funktion er nyttig til at udtrække specifikke felter fra formularer, fakturaer og andre skabelondokumenter. Samlet set er Aspose.OCR-biblioteket et værdifuldt værktøj for udviklere, der ønsker at integrere OCR‑funktionalitet i deres Node.js‑applikationer.
Kom i gang med AAspose.OCR-biblioteket for Node.js via C++
Den anbefalede måde at installere Aspose.OCR-biblioteket for Node.js via C++ er ved at bruge npm. Brug venligst følgende kommando for en problemfri installation.
Install Aspose.OCR library for Node.js via C++ via npm
npm install aspose-ocr-cloud Du kan downloade biblioteket direkte fra Aspose.OCR produktsiden
Aspose.OCR-biblioteket for Node.js via C++ har leveret komplet funktionalitet til at udføre optisk tegngenkendelse (OCR) på forskellige billeder. Med blot et par linjer kode kan softwareudviklere genkende og udtrække tekst fra billeder i Node.js‑applikationer. API’en understøtter en række populære billedfilformater, såsom JPEG, PNG, GIF, TIFF, PDF, BMP og mange flere. Der er flere vigtige funktioner i biblioteket, såsom genkendelse af roterede, skæve og støjende billeder. Desuden kan udviklere gemme genkendelsesresultaterne i de mest populære dokument‑ og dataudvekslingsformater. Følgende eksempel viser, hvordan JavaScript‑kommandoer kan bruges til at indlæse og udtrække tekst fra et billede.
Sådan genkendes tekst fra et billede i Node.js‑apps?
let source = Module.WasmAsposeOCRInput();
source.url = internalFileName;
let batch = new Module.WasmAsposeOCRInputs();
batch.push_back(source);
// Send image for OCR
var result = Module.AsposeOCRRecognize(batch);
// Output extracted text to the console
var text = Module.AsposeOCRSerializeResult(
result, Module.ExportFormat.text);
console.log(text);
Håndskrevet tekstgenkendelse i Node.js‑apps
Aspose.OCR-biblioteket for Node.js via C++ gør det nemt for softwareudviklere at genkende håndskrevet tekst i deres egne Node.js‑applikationer. Det kan genkende håndskrevet tekst ud over trykt tekst, hvilket udvider dets anvendelighed til et bredere udvalg af dokumenter. Udviklere kan genkende håndskrevet tekst ved at aktivere håndskrevet‑tilstand. Det er også muligt at genkende et billede fra en URL uden at downloade det lokalt. Følgende eksempel viser, hvordan udviklere kan indlæse og genkende håndskrevet tekst i node.js‑applikationer.
Sådan genkendes håndskrevet tekst i Node.js‑apps
const recognizeHandwritten = true;
ocrApi.recognizeFromContent('eng', recognizeHandwritten, imageBuffer, (error, data) => {
if (error) throw error;
console.log('Extracted Handwritten Text:', data.text);
});
Skabelonbaseret genkendelsesunderstøttelse
Skabelonbaseret genkendelse indebærer at definere en skabelon, der angiver layoutet og interesseområderne i et dokument. Skabelonbaseret genkendelse med Aspose.OCR for Node.js via C++ giver en struktureret og præcis måde at udtrække data fra dokumenter med faste layout på. Denne funktion er nyttig til at udtrække specifikke felter fra formularer, fakturaer og andre skabelondokumenter. Her er et meget nyttigt eksempel, der viser, hvordan softwareudviklere kan indlæse skabelonen og anvende den på et billede til OCR i Node.js‑apps.
Sådan indlæses skabelonen og anvendes på et billede til OCR i Node.js‑apps?
const fs = require('fs');
const { OcrApi, AsposeApp, TemplateApi } = require('aspose-ocr-cloud');
const appSid = 'your-app-sid';
const appKey = 'your-app-key';
AsposeApp.appSID = appSid;
AsposeApp.appKey = appKey;
const ocrApi = new OcrApi();
const templateApi = new TemplateApi();
const imagePath = 'path/to/your/invoice.jpg';
const templatePath = 'path/to/your/template.json';
fs.readFile(imagePath, (err, imageBuffer) => {
if (err) throw err;
fs.readFile(templatePath, (err, templateBuffer) => {
if (err) throw err;
// Load the template
templateApi.addTemplate(templateBuffer, (error, templateId) => {
if (error) throw error;
// Apply the template to the image
ocrApi.recognizeFromTemplate(imageBuffer, templateId, (error, result) => {
if (error) throw error;
console.log('Extracted Data:', result.fields);
});
});
});
});
Bevar tekstformatering i OCR‑operationer
Bevaring af tekstformatering under OCR‑operationer er afgørende for applikationer, hvor strukturen, skrifttype og layout af teksten er vigtige. Ud over at udtrække ren tekst kan Aspose.OCR for Node.js via C++ også bevare formateringen af den genkendte tekst, herunder skrifttype, størrelse og farver. Dette er især nyttigt ved behandling af dokumenter, hvor tekstformatering er kritisk. Nedenfor er et eksempel, der demonstrerer, hvordan softwareudviklere kan bevare tekstformatering ved hjælp af Aspose.OCR‑API’en.
Sådan bevares tekstformatering i OCR‑operationer i Node.js‑apps?
const fs = require('fs');
const { OcrApi, AsposeApp, OCRFormat, OCRRecognitionSettings } = require('aspose-ocr-cloud');
const appSid = 'your-app-sid';
const appKey = 'your-app-key';
AsposeApp.appSID = appSid;
AsposeApp.appKey = appKey;
const ocrApi = new OcrApi();
const imagePath = 'path/to/your/document.jpg';
fs.readFile(imagePath, (err, imageBuffer) => {
if (err) throw err;
const recognitionSettings = new OCRRecognitionSettings();
recognitionSettings.setDetectAreas(true);
recognitionSettings.setDetectText(true);
recognitionSettings.setDetectItalic(true);
recognitionSettings.setDetectBold(true);
ocrApi.recognizeWithSettings(imageBuffer, OCRFormat.TEXT, recognitionSettings, (error, data) => {
if (error) throw error;
const formattedText = data.text;
const formattingDetails = data.textAreas;
console.log('Extracted Text with Formatting:', formattedText);
console.log('Formatting Details:', formattingDetails);
});
});
