Aspose.OCR for C++
C++ OCR API az OCR képességek hozzáadásához
Integrálja az OCR funkcionalitást a C & C++ alkalmazásokba az ingyenes OCR API segítségével. Felismerhet és kivonhat szöveget a beolvasott képekből és PDF-ekből, okostelefonos fényképekből, képernyőképekből és képterületekről.
A digitális korszak továbbterjedésével szükségessé válik a képekből, beszkennelt dokumentumokból és egyéb forrásokból származó hatékony szövegkivonás. Ez az a hely, ahol az optikai karakterfelismerő (OCR) technológia létfontosságú szerepet játszik a vizuális adatok szerkeszthető és kereshető szöveggé alakításában. Az Aspose.OCR for C++ hatékony megoldásként jelenik meg, átfogó eszközkészletet kínálva a fejlesztőknek az OCR képességek zökkenőmentes integrálásához C++ alkalmazásaikba. Függetlenül attól, hogy a fejlesztőknek szöveget kell kivonniuk beolvasott dokumentumokból, képekből vagy akár képernyőképekből, az Aspose.OCR átfogó megoldást kínál a különféle OCR-követelmények kezelésére.
Az Aspose.OCR for C++ a képfeldolgozási funkciók gazdag készletét kínálja, amelyek javítják az OCR pontosságát és javítják a felismerési folyamatot. A könyvtárnak számos fontos funkciója van, mint például az elforgatott és zajos képek feldolgozása, számos nyelvű szöveg felismerése, az összes kép kötegelt felismerése, a teljes kép felismerése, csak a kiválasztott területekről bontja ki a szöveget, azonosítja a szavakat vagy a bekezdéseket, elmenti a felismerési eredményeket a lemezre, kép előfeldolgozás támogatása, Azonosítja a karaktereket a képen, azonosítja a karaktereket a képen, csak a kép bizonyos területeit olvassa be és így tovább. A szoftverfejlesztők többek között szűrők alkalmazásával, a kontraszt és a fényerő beállításával, a torzítás megszüntetésével és a zajeltávolítással is elődolgozhatják a képeket.
Az Aspose.OCR for C++ könnyen integrálható a felhasználói alkalmazásokba, valamint más Aspose termékekbe. A könyvtár egy nagyon egyszerű API-t biztosít, amely lehetővé teszi a fejlesztők számára, hogy zökkenőmentesen beépítsék az OCR képességeket C++ projektjeikbe. Csak néhány sornyi kóddal a fejlesztők inicializálhatják az OCR-motort, betölthetik a képet vagy a dokumentumot, és kivonhatják a szöveget. Többplatformosra tervezték, és többplatformos alkalmazások fejlesztésére használható Windowsra, Linuxra és webre. Az Aspose.OCR projektjeikbe való integrálásával a szoftverfejlesztők növelhetik a termelékenységet, javíthatják az adatok hozzáférhetőségét, és új lehetőségeket nyithatnak meg alkalmazásaikban a szövegfeldolgozás és -elemzés terén.
Kezdő lépések az Aspose.OCR-rel C++-hoz
Az Aspose.OCR for C++ telepítésének javasolt módja a NuGet használata. Kérjük, használja a következő parancsot a zökkenőmentes telepítés érdekében.
Telepítse az Aspose.OCR-t C++-hoz a NuGet Command segítségével
NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0
A könyvtárat közvetlenül letöltheti az Aspose.PDF termékoldaláról
Hatékony szövegkivonás a C++ alkalmazásokban
Az Aspose.OCR for C++ megbízható és hatékony módszert kínál szövegek kinyerésére számos fájlformátumból, beleértve a beolvasott dokumentumokat, képeket, PDF fájlokat, többoldalas TIFF-et, pixeltömböt, nyugtákat és így tovább. Kifinomult OCR-algoritmusokat használ a szöveg nagy pontosságú felismerésére és kibontására, megőrizve az eredeti formázást és szerkezetet. A könyvtár sokféle nyelvet támogat, így alkalmassá teszi többnyelvű alkalmazásokhoz, és lehetővé teszi a fejlesztők számára, hogy könnyedén kinyerhessenek szöveget különböző forrásokból. A következő példa bemutatja, hogyan lehet szöveget kivonni a TIFF-képből C++ API-n keresztül.
Szöveg kinyerése a TIFF-képből C++ API-n keresztül?
std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;
A képek bizonyos területeinek olvasása C++-on keresztül
Az Aspose.OCR for C++ megkönnyíti a szoftverfejlesztők számára a kép egy adott részének elolvasását, és a C++ alkalmazásokon belüli szövegek kibontását azokról a területekről vagy régiókból. Ez a funkció különösen akkor hasznos, ha csak a kép bizonyos részeiből kell szöveget kivonni, és ki szeretné zárni az irreleváns tartalmat. A könyvtár egyszerű és hatékony módszert kínál erre. Az alábbiakban egy példa kódrészlet látható, amely bemutatja, hogyan lehet a képek bizonyos területeit olvasni az Aspose.OCR for C++ használatával.
Szöveg kinyerése egy kép adott régióiból C++ API-n keresztül
// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;
Kép előfeldolgozása C++ API-n keresztül
Az Aspose.OCR for C++ szabványos módot biztosít a tartalom OCR-re való felkészítéséhez és a pontos OCR-eredmények eléréséhez. A könyvtár fejlett kép-előfeldolgozási technikákat kínál. Ezek a technikák javítják a képminőséget, korrigálják a perspektivikus torzítást, eltávolítják a zajt és optimalizálják a szövegfelismerési folyamatot. A kép-előfeldolgozás alkalmazásával a fejlesztők jelentősen javíthatják az OCR pontosságát, különösen akkor, ha kihívást jelentő képekkel vagy összetett elrendezésű dokumentumokkal foglalkoznak. Több előfeldolgozó szűrő is alkalmazható ugyanarra a képre a felismerés minőségének további javítása érdekében.
Automatikusan távolítsa el a zajt a képről a C++ API-n keresztüli felismerés előtt
// Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;
// apply Preprocessing filter
std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);
A felismerési eredmények mentése más formátumban
Az Aspose.OCR for C++ lehetővé teszi a szoftverfejlesztők számára, hogy felismerjék a szöveget számos népszerű fájlformátumból, például PDF, JPEG, PNG, TIFF, BMP stb. Az API lehetővé teszi a fejlesztők számára, hogy a felismerési eredményeket többféle formátumban is elmentsék, így azok megoszthatók, adatbázisban tárolhatók, megjeleníthetők vagy elemezhetők. A szoftverfejlesztők a felismerési eredményeket fájlként, szövegként, JSON-ként vagy XML-ként menthetik. A könyvtár lehetővé teszi a felismerési megbízhatósági küszöbök beállítását, lehetővé téve a szoftverfejlesztők számára, hogy alacsony megbízhatósági szinttel szűrjék ki a szöveget. Ez a funkció felbecsülhetetlen értékűnek bizonyul nagy mennyiségű szöveg kezelésekor, biztosítva, hogy csak megbízható és pontos eredményeket nyerjenek ki. A következő példák bemutatják, hogyan lehet a felismerési eredményeket fájlként menteni C++ parancsokkal.
A felismerési eredmények mentése többoldalas dokumentumként a C++ API-n keresztül
directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);