Aspose.OCR for C++
C++ OCR API OCR-ominaisuuksien lisäämiseen
Integroi OCR-toiminnot C- ja C++-sovelluksiin ilmaisen OCR-sovellusliittymän avulla. Se voi tunnistaa ja poimia tekstiä skannatuista kuvista ja PDF-tiedostoista, älypuhelimen valokuvista, kuvakaappauksista ja kuvaalueista.
Kun digitaalinen aikakausi laajenee, tarvitaan tehokasta tekstin poimimista kuvista, skannatuista asiakirjoista ja muista lähteistä. Tässä optisella merkintunnistustekniikalla (OCR) on tärkeä rooli visuaalisten tietojen muuntamisessa muokattavaksi ja haettavaksi tekstiksi. Aspose.OCR for C++ on tehokas ratkaisu, joka tarjoaa kehittäjille kattavan työkalupakin OCR-ominaisuuksien integroimiseksi saumattomasti C++-sovelluksiinsa. Olipa kehittäjien tarpeen poimia tekstiä skannatuista asiakirjoista, kuvista tai jopa kuvakaappauksista, Aspose.OCR tarjoaa kattavan ratkaisun erilaisiin OCR-vaatimuksiin.
Aspose.OCR for C++ tarjoaa runsaasti kuvankäsittelyominaisuuksia, jotka parantavat OCR-tarkkuutta ja tunnistusprosessia. Kirjastossa on useita tärkeitä ominaisuuksia, kuten pyörivien ja meluisten kuvien käsittely, tekstin tunnistaminen useilla kielillä, kaikkien kuvien erätunnistus, koko kuvan tunnistaminen, tekstin poimiminen vain valituilta alueilta, sanojen tai kappaleiden tunnistaminen, tallentaa tunnistustulokset levylle, kuvan esikäsittelyn tuen, Tunnistaa kuvan merkit, Tunnistaa kuvan merkit, lukee vain tietyt kuvan alueet ja niin edelleen. Ohjelmistokehittäjät voivat esikäsitellä kuvia muun muassa käyttämällä suodattimia, säätämällä kontrastia ja kirkkautta, vääristymistä ja kohinanpoistoa.
Aspose.OCR for C++ voidaan helposti integroida käyttäjän sovelluksiin sekä muihin Aspose-tuotteisiin. Kirjasto tarjoaa erittäin suoraviivaisen API:n, jonka avulla kehittäjät voivat sisällyttää OCR-ominaisuudet saumattomasti C++-projekteihinsa. Vain muutamalla koodirivillä kehittäjät voivat alustaa OCR-moottorin, ladata kuvan tai asiakirjan ja poimia tekstin. Se on suunniteltu monialustaiseksi, ja sitä voidaan käyttää eri alustojen sovellusten kehittämiseen Windowsille, Linuxille ja webille. Integroimalla Aspose.OCR:n projekteihinsa ohjelmistokehittäjät voivat parantaa tuottavuutta, parantaa tietojen saatavuutta ja avata uusia mahdollisuuksia tekstinkäsittelyyn ja analysointiin sovelluksissaan.
C++:n Aspose.OCR:n käytön aloittaminen
Suositeltava tapa asentaa Aspose.OCR for C++ on NuGet. Käytä seuraavaa komentoa sujuvaan asennukseen.
Asenna Aspose.OCR for C++ NuGet Commandin kautta
NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0
Voit ladata kirjaston suoraan Aspose.PDF-tuotesivulta
Tehokas tekstin purku C++-sovelluksissa
Aspose.OCR for C++ tarjoaa luotettavan ja tehokkaan tavan poimia tekstiä useista tiedostomuodoista, mukaan lukien skannatut asiakirjat, kuvat, PDF-tiedostot, monisivuiset TIFF-tiedostot, pikseliryhmä, kuitit ja niin edelleen. Se käyttää kehittyneitä OCR-algoritmeja tekstin tunnistamiseen ja poimimiseen suurella tarkkuudella säilyttäen alkuperäisen muotoilun ja rakenteen. Kirjasto tukee monenlaisia kieliä, mikä tekee siitä sopivan monikielisiin sovelluksiin ja mahdollistaa kehittäjien poimia tekstiä eri lähteistä vaivattomasti. Seuraava esimerkki näyttää kuinka poimia tekstiä TIFF-kuvasta C++ API:n kautta.
Poimitaanko tekstiä TIFF-kuvasta C++ API:n kautta?
std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;
Lue tiettyjä kuvien alueita C++:n kautta
Aspose.OCR for C++ tekee ohjelmistokehittäjien helpoksi lukea tietyn kuvan aluetta ja poimia tekstiä C++-sovellusten sisältämiltä alueilta tai alueilta. Tämä ominaisuus on erityisen hyödyllinen, kun haluat poimia tekstiä vain tietyistä kuvan osista ja haluat sulkea pois epäolennaisen sisällön. Kirjasto tarjoaa yksinkertaisen ja tehokkaan tavan saavuttaa tämä. Alla on esimerkkikoodinpätkä, joka havainnollistaa tiettyjen kuvien alueiden lukemista käyttämällä Aspose.OCR for C++ -ohjelmaa.
Pura teksti tietyiltä kuvan alueilta C++ API:n kautta
// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;
Kuvan esikäsittely C++ API:n kautta
Aspose.OCR for C++ on tarjonnut standardoidun tavan valmistella sisältösi tekstintunnistusta varten ja saavuttaa tarkkoja OCR-tuloksia. Kirjasto tarjoaa valikoiman edistyneitä kuvan esikäsittelytekniikoita. Nämä tekniikat parantavat kuvanlaatua, korjaavat perspektiivivääristymiä, poistavat kohinaa ja optimoivat tekstintunnistusprosessia. Käyttämällä kuvien esikäsittelyä kehittäjät voivat parantaa merkittävästi OCR:n tarkkuutta, varsinkin kun käsitellään haastavia kuvia tai asiakirjoja, joissa on monimutkainen asettelu. Useita esikäsittelysuodattimia voidaan käyttää samaan kuvaan tunnistuslaadun parantamiseksi.
Poista kohina kuvasta automaattisesti ennen tunnistusta C++ API:n kautta
// Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;
// apply Preprocessing filter
std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);
Tallenna tunnistustulokset muissa muodoissa
Aspose.OCR for C++ antaa ohjelmistokehittäjille mahdollisuuden tunnistaa tekstiä useista suosituista tiedostomuodoista, kuten PDF, JPEG, PNG, TIFF, BMP ja muut. Sovellusliittymän avulla kehittäjät voivat tallentaa tunnistustuloksia useissa muodoissa, jotta ne voidaan jakaa, tallentaa tietokantaan, näyttää tai analysoida. Ohjelmistokehittäjät voivat tallentaa tunnistustulokset tiedostona, tekstinä, JSON- tai XML-muodossa. Kirjasto mahdollistaa tunnistuksen luotettavuuskynnysten asettamisen, jolloin ohjelmistokehittäjät voivat suodattaa pois tekstiä alhaisella luottamustasolla. Tämä ominaisuus osoittautuu korvaamattomaksi suuria tekstimääriä käsiteltäessä, mikä varmistaa, että saadaan vain luotettavia ja tarkkoja tuloksia. Seuraavat esimerkit osoittavat, kuinka tunnistustulokset tallennetaan tiedostoksi C++-komentojen avulla.
Tallenna tunnistustulokset monisivuiseksi asiakirjaksi C++ API:n kautta
directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);