Aspose.OCR for C++
API C++ OCR umożliwiające dodawanie możliwości OCR
Zintegruj funkcjonalność OCR z aplikacjami C i C++, korzystając z bezpłatnego interfejsu API OCR. Potrafi rozpoznawać i wyodrębniać tekst ze zeskanowanych obrazów i plików PDF, zdjęć ze smartfonów, zrzutów ekranu i obszarów obrazów.
W miarę rozszerzania się ery cyfrowej konieczne staje się wydajne wyodrębnianie tekstu z obrazów, zeskanowanych dokumentów i innych źródeł. W tym miejscu technologia optycznego rozpoznawania znaków (OCR) odgrywa kluczową rolę w przekształcaniu danych wizualnych w tekst, który można edytować i przeszukiwać. Aspose.OCR dla C++ okazuje się potężnym rozwiązaniem, oferującym programistom kompleksowy zestaw narzędzi do płynnej integracji funkcji OCR z ich aplikacjami C++. Niezależnie od tego, czy programiści muszą wyodrębnić tekst ze zeskanowanych dokumentów, obrazów, a nawet zrzutów ekranu, Aspose.OCR zapewnia kompleksowe rozwiązanie spełniające różne wymagania OCR.
Aspose.OCR dla C++ oferuje bogaty zestaw funkcji przetwarzania obrazu, które zwiększają dokładność OCR i usprawniają proces rozpoznawania. Biblioteka zawiera kilka ważnych funkcji, takich jak przetwarzanie obróconych i zaszumionych obrazów, rozpoznawanie tekstu w wielu językach, wsadowe rozpoznawanie wszystkich obrazów, rozpoznawanie całego obrazu, wyodrębnianie tekstu tylko z wybranych obszarów, identyfikowanie słów lub akapitów, zapisuje wyniki rozpoznawania na dysku, obsługuje wstępne przetwarzanie obrazu, Identyfikuje znaki na obrazie, Identyfikuje znaki na obrazie, odczytuje tylko określone obszary obrazu i tak dalej. Twórcy oprogramowania mogą wstępnie przetwarzać obrazy, między innymi stosując filtry, dostosowując kontrast i jasność, prostowanie i usuwanie szumów.
Aspose.OCR dla C++ można łatwo zintegrować z aplikacjami użytkownika, a także z innymi produktami Aspose. Biblioteka zapewnia bardzo prosty interfejs API, który pozwala programistom bezproblemowo włączać funkcje OCR do swoich projektów C++. Za pomocą zaledwie kilku linii kodu programiści mogą zainicjować silnik OCR, załadować obraz lub dokument i wyodrębnić tekst. Został zaprojektowany jako wieloplatformowy i może być używany do tworzenia aplikacji wieloplatformowych dla systemów Windows, Linux i sieci Web. Integrując Aspose.OCR ze swoimi projektami, twórcy oprogramowania mogą zwiększyć produktywność, poprawić dostępność danych i odblokować nowe możliwości przetwarzania i analizy tekstu w swoich aplikacjach.
Pierwsze kroki z Aspose.OCR dla C++
Zalecany sposób instalacji Aspose.OCR dla C++ polega na użyciu NuGet. Aby instalacja przebiegła bezproblemowo, użyj poniższego polecenia.
Zainstaluj Aspose.OCR dla C++ za pomocą polecenia NuGet
NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0
Możesz pobrać bibliotekę bezpośrednio ze strony produktu Aspose.PDF
Efektywna ekstrakcja tekstu w aplikacjach C++
Aspose.OCR dla C++ zapewnia niezawodne i wydajne podejście do wyodrębniania tekstu z szerokiej gamy formatów plików, w tym zeskanowanych dokumentów, obrazów, plików PDF, wielostronicowych TIFF, tablicy pikseli, paragonów i tak dalej. Wykorzystuje zaawansowane algorytmy OCR do rozpoznawania i wyodrębniania tekstu z dużą dokładnością, zachowując oryginalne formatowanie i strukturę. Biblioteka obsługuje szeroką gamę języków, dzięki czemu nadaje się do aplikacji wielojęzycznych i umożliwia programistom bezproblemowe wyodrębnianie tekstu z różnych źródeł. Poniższy przykład pokazuje, jak wyodrębnić tekst z obrazu TIFF za pośrednictwem interfejsu API języka C++.
Wyodrębnianie tekstu z obrazu TIFF za pomocą interfejsu API C++?
std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;
Odczytuj określone obszary obrazów za pomocą C++
Aspose.OCR dla C++ ułatwia twórcom oprogramowania odczytywanie określonego obszaru obrazu i wyodrębnianie tekstu z tych obszarów lub regionów w aplikacjach C++. Ta funkcja jest szczególnie przydatna, gdy chcesz wyodrębnić tekst tylko z określonych sekcji obrazu i chcesz wykluczyć nieistotne treści. Biblioteka oferuje prostą i skuteczną metodę osiągnięcia tego celu. Poniżej znajduje się przykładowy fragment kodu pokazujący, jak czytać określone obszary obrazów przy użyciu Aspose.OCR dla C++.
Wyodrębnij tekst z określonych obszarów obrazu za pomocą interfejsu API C++
// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;
Wstępne przetwarzanie obrazu przez API C++
Aspose.OCR dla C++ zapewnia ustandaryzowany sposób przygotowania treści do OCR i uzyskania dokładnych wyników OCR. Biblioteka oferuje szereg zaawansowanych technik wstępnego przetwarzania obrazu. Techniki te poprawiają jakość obrazu, korygują zniekształcenia perspektywy, usuwają szumy i optymalizują proces rozpoznawania tekstu. Stosując wstępne przetwarzanie obrazu, programiści mogą znacznie poprawić dokładność rozpoznawania OCR, szczególnie w przypadku trudnych obrazów lub dokumentów o złożonym układzie. Do tego samego obrazu można zastosować wiele filtrów wstępnego przetwarzania, aby jeszcze bardziej poprawić jakość rozpoznawania.
Automatycznie usuwaj szumy z obrazu przed rozpoznaniem za pomocą interfejsu API C++
// Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;
// apply Preprocessing filter
std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);
Zapisz wyniki rozpoznawania w innych formatach
Aspose.OCR dla C++ umożliwia twórcom oprogramowania rozpoznawanie tekstu z wielu popularnych formatów plików, takich jak PDF, JPEG, PNG, TIFF, BMP i innych. Interfejs API umożliwia programistom zapisywanie wyników rozpoznawania w wielu formatach, dzięki czemu można je udostępniać, przechowywać w bazie danych, wyświetlać lub analizować. Twórcy oprogramowania mogą zapisywać wyniki rozpoznawania jako plik, tekst, JSON lub XML. Biblioteka umożliwia ustawienie progów pewności rozpoznawania, umożliwiając twórcom oprogramowania filtrowanie tekstu o niskim poziomie pewności. Ta funkcja okazuje się nieoceniona w przypadku dużych ilości tekstu, zapewniając, że wydobywane są tylko wiarygodne i dokładne wyniki. Poniższe przykłady pokazują, jak zapisać wyniki rozpoznawania jako plik przy użyciu poleceń C++.
Zapisz wyniki rozpoznawania jako dokument wielostronicowy za pośrednictwem interfejsu API C++
directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);