Aspose.OCR for C++
API C++ OCR per aggiungere funzionalità OCR
Integra la funzionalità OCR all'interno delle app C e C++ utilizzando l'API OCR gratuita. Può riconoscere ed estrarre testo da immagini e PDF scansionati, foto di smartphone, screenshot e aree di immagini.
Con la continua espansione dell'era digitale, diventa necessaria la necessità di un'estrazione efficiente del testo da immagini, documenti scansionati e altre fonti. È qui che la tecnologia di riconoscimento ottico dei caratteri (OCR) gioca un ruolo fondamentale nel convertire i dati visivi in testo modificabile e ricercabile. Aspose.OCR per C++ emerge come una soluzione potente, offrendo agli sviluppatori un kit di strumenti completo per integrare perfettamente le funzionalità OCR nelle loro applicazioni C++. Se gli sviluppatori hanno bisogno di estrarre testo da documenti scansionati, immagini o anche screenshot, Aspose.OCR fornisce una soluzione completa per gestire vari requisiti OCR.
Aspose.OCR per C++ offre un ricco set di funzionalità di elaborazione delle immagini che migliorano la precisione dell'OCR e migliorano il processo di riconoscimento. Ci sono diverse funzionalità importanti nella libreria, come l'elaborazione di immagini ruotate e rumorose, il riconoscimento del testo in un gran numero di lingue, il riconoscimento batch di tutte le immagini, il riconoscimento dell'intera immagine, l'estrazione del testo solo da aree selezionate, l'identificazione di parole o paragrafi, salva i risultati del riconoscimento sul disco, supporto per la preelaborazione delle immagini, identifica i caratteri su un'immagine, identifica i caratteri su un'immagine, legge solo alcune aree di un'immagine e così via. Gli sviluppatori di software possono preelaborare le immagini applicando filtri, regolando il contrasto e la luminosità, l'allineamento e la rimozione del rumore, tra le altre operazioni.
Aspose.OCR per C++ può essere facilmente integrato nelle applicazioni dell'utente e con altri prodotti Aspose. La libreria fornisce un'API molto semplice che consente agli sviluppatori di incorporare perfettamente le funzionalità OCR nei loro progetti C++. Con poche righe di codice, gli sviluppatori possono inizializzare il motore OCR, caricare l'immagine o il documento ed estrarre il testo. È progettato per essere multipiattaforma e può essere utilizzato per sviluppare applicazioni multipiattaforma per Windows, Linux e Web. Integrando Aspose.OCR nei loro progetti, gli sviluppatori di software possono aumentare la produttività, migliorare l'accessibilità ai dati e sbloccare nuove possibilità per l'elaborazione e l'analisi del testo nelle loro applicazioni.
Introduzione a Aspose.OCR per C++
Il modo consigliato per installare Aspose.OCR per C++ è utilizzare NuGet. Si prega di utilizzare il seguente comando per un'installazione fluida.
Installa Aspose.OCR per C++ tramite il comando NuGet
NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0
Puoi scaricare la libreria direttamente dalla Aspose.PDF pagina del prodotto
Estrazione efficiente del testo nelle app C++
Aspose.OCR per C++ fornisce un approccio affidabile ed efficiente per estrarre testo da un'ampia varietà di formati di file, inclusi documenti scansionati, immagini, file PDF, TIFF multipagina, array di pixel, ricevute e così via. Utilizza sofisticati algoritmi OCR per riconoscere ed estrarre il testo con elevata precisione, preservando la formattazione e la struttura originali. La libreria supporta un'ampia gamma di lingue, rendendola adatta per applicazioni multilingue e consentendo agli sviluppatori di estrarre testo da diverse fonti senza sforzo. L'esempio seguente mostra come estrarre il testo dall'immagine TIFF tramite l'API C++.
Estrai testo da un'immagine TIFF tramite API C++?
std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;
Leggi alcune aree delle immagini tramite C++
Aspose.OCR per C++ semplifica la lettura da parte degli sviluppatori di software di un'area particolare di un'immagine e l'estrazione del testo da tali aree o regioni all'interno delle applicazioni C++. Questa funzionalità è particolarmente utile quando devi estrarre testo solo da sezioni specifiche di un'immagine e desideri escludere contenuti irrilevanti. La biblioteca offre un metodo semplice ed efficace per raggiungere questo obiettivo. Di seguito è riportato un frammento di codice di esempio che mostra come leggere determinate aree di immagini utilizzando Aspose.OCR per C++.
Estrai testo da aree specifiche all'interno di un'immagine tramite API C++
// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;
Preelaborazione delle immagini tramite API C++
Aspose.OCR per C++ ha fornito un modo standardizzato per preparare i tuoi contenuti per l'OCR e ottenere risultati OCR accurati. La libreria offre una gamma di tecniche avanzate di preelaborazione delle immagini. Queste tecniche migliorano la qualità dell'immagine, correggono la distorsione prospettica, rimuovono il rumore e ottimizzano il processo di riconoscimento del testo. Utilizzando la preelaborazione delle immagini, gli sviluppatori possono migliorare significativamente la precisione dell'OCR, soprattutto quando si tratta di immagini o documenti complessi con layout complessi. È possibile applicare più filtri di preelaborazione alla stessa immagine per migliorare ulteriormente la qualità del riconoscimento.
Rimuovi automaticamente il rumore dall'immagine prima del riconoscimento tramite API C++
// Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;
// apply Preprocessing filter
std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);
Salva i risultati del riconoscimento in altri formati
Aspose.OCR per C++ consente agli sviluppatori di software di riconoscere il testo da numerosi formati di file popolari, come PDF, JPEG, PNG, TIFF, BMP e altri. L'API consente agli sviluppatori di salvare i risultati del riconoscimento in più formati in modo che possano essere condivisi, archiviati in un database, visualizzati o analizzati. Gli sviluppatori di software possono salvare i risultati del riconoscimento come file, testo, JSON o XML. La libreria consente di impostare soglie di confidenza del riconoscimento, consentendo agli sviluppatori di software di filtrare il testo con bassi livelli di confidenza. Questa funzionalità si rivela preziosa quando si ha a che fare con grandi volumi di testo, garantendo che vengano estratti solo risultati affidabili e accurati. Negli esempi seguenti viene illustrato come salvare i risultati del riconoscimento come file utilizzando i comandi C++.
Salva i risultati del riconoscimento come documento multipagina tramite API C++
directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);