Aspose.OCR for C++

API C++ OCR umożliwiające dodawanie możliwości OCR

Zintegruj funkcjonalność OCR z aplikacjami C i C++, korzystając z bezpłatnego interfejsu API OCR. Potrafi rozpoznawać i wyodrębniać tekst ze zeskanowanych obrazów i plików PDF, zdjęć ze smartfonów, zrzutów ekranu i obszarów obrazów.

W miarę rozszerzania się ery cyfrowej konieczne staje się wydajne wyodrębnianie tekstu z obrazów, zeskanowanych dokumentów i innych źródeł. W tym miejscu technologia optycznego rozpoznawania znaków (OCR) odgrywa kluczową rolę w przekształcaniu danych wizualnych w tekst, który można edytować i przeszukiwać. Aspose.OCR dla C++ okazuje się potężnym rozwiązaniem, oferującym programistom kompleksowy zestaw narzędzi do płynnej integracji funkcji OCR z ich aplikacjami C++. Niezależnie od tego, czy programiści muszą wyodrębnić tekst ze zeskanowanych dokumentów, obrazów, a nawet zrzutów ekranu, Aspose.OCR zapewnia kompleksowe rozwiązanie spełniające różne wymagania OCR.

Aspose.OCR dla C++ oferuje bogaty zestaw funkcji przetwarzania obrazu, które zwiększają dokładność OCR i usprawniają proces rozpoznawania. Biblioteka zawiera kilka ważnych funkcji, takich jak przetwarzanie obróconych i zaszumionych obrazów, rozpoznawanie tekstu w wielu językach, wsadowe rozpoznawanie wszystkich obrazów, rozpoznawanie całego obrazu, wyodrębnianie tekstu tylko z wybranych obszarów, identyfikowanie słów lub akapitów, zapisuje wyniki rozpoznawania na dysku, obsługuje wstępne przetwarzanie obrazu, Identyfikuje znaki na obrazie, Identyfikuje znaki na obrazie, odczytuje tylko określone obszary obrazu i tak dalej. Twórcy oprogramowania mogą wstępnie przetwarzać obrazy, między innymi stosując filtry, dostosowując kontrast i jasność, prostowanie i usuwanie szumów.

Aspose.OCR dla C++ można łatwo zintegrować z aplikacjami użytkownika, a także z innymi produktami Aspose. Biblioteka zapewnia bardzo prosty interfejs API, który pozwala programistom bezproblemowo włączać funkcje OCR do swoich projektów C++. Za pomocą zaledwie kilku linii kodu programiści mogą zainicjować silnik OCR, załadować obraz lub dokument i wyodrębnić tekst. Został zaprojektowany jako wieloplatformowy i może być używany do tworzenia aplikacji wieloplatformowych dla systemów Windows, Linux i sieci Web. Integrując Aspose.OCR ze swoimi projektami, twórcy oprogramowania mogą zwiększyć produktywność, poprawić dostępność danych i odblokować nowe możliwości przetwarzania i analizy tekstu w swoich aplikacjach.

W skrócie

Przegląd funkcji Aspose.OCR dla C++.

Przegląd funkcji

Wykonaj OCR
Dodaj możliwości OCR
Rozpoznaj tekst obrazu
Przekształcaj obrazy tekstu
Rozpoznany tekst czcionki
Wyszukaj plik PDF
27 języków rozpoznawania
Twórz aplikacje OCR
Zapisz w przeglądarce
Wyodrębnij tekst
Obsługa wielowątkowości

Przegląd funkcji

Rozpoznaj obrócony obraz
Filtry wstępnego przetwarzania
PDF do obrazów
Rozpoznaje znaki chińskie
Wykrywa popularne kroje pisma
Przetwarza cały obraz
Obsługa obróconych obrazów
Rozpoznawanie partii
Wbudowany moduł sprawdzania pisowni
Podziel plik PDF
PDF do Excela
PDF do SVG

Aspose.OCR for C++

API obsługuje głównie format PDF, ale może eksportować dokumenty PDF do wielu innych formatów.

Czytelnik

PDF, PDF/A, TEX, XPS, SVG

Pisarz

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR for C++

Niezależność od platformy

Aspose.OCR dla C++ może współpracować z dowolnym językiem programowania opartym na C++.

C++ runtime.

Aspose.OCR for C++

Pierwsze kroki z Aspose.OCR dla C++

Zalecany sposób instalacji Aspose.OCR dla C++ polega na użyciu NuGet. Aby instalacja przebiegła bezproblemowo, użyj poniższego polecenia.

Zainstaluj Aspose.OCR dla C++ za pomocą polecenia NuGet

 NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0

Możesz pobrać bibliotekę bezpośrednio ze strony produktu Aspose.PDF

Efektywna ekstrakcja tekstu w aplikacjach C++

Aspose.OCR dla C++ zapewnia niezawodne i wydajne podejście do wyodrębniania tekstu z szerokiej gamy formatów plików, w tym zeskanowanych dokumentów, obrazów, plików PDF, wielostronicowych TIFF, tablicy pikseli, paragonów i tak dalej. Wykorzystuje zaawansowane algorytmy OCR do rozpoznawania i wyodrębniania tekstu z dużą dokładnością, zachowując oryginalne formatowanie i strukturę. Biblioteka obsługuje szeroką gamę języków, dzięki czemu nadaje się do aplikacji wielojęzycznych i umożliwia programistom bezproblemowe wyodrębnianie tekstu z różnych źródeł. Poniższy przykład pokazuje, jak wyodrębnić tekst z obrazu TIFF za pośrednictwem interfejsu API języka C++.

Wyodrębnianie tekstu z obrazu TIFF za pomocą interfejsu API C++?

std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;

Odczytuj określone obszary obrazów za pomocą C++

Aspose.OCR dla C++ ułatwia twórcom oprogramowania odczytywanie określonego obszaru obrazu i wyodrębnianie tekstu z tych obszarów lub regionów w aplikacjach C++. Ta funkcja jest szczególnie przydatna, gdy chcesz wyodrębnić tekst tylko z określonych sekcji obrazu i chcesz wykluczyć nieistotne treści. Biblioteka oferuje prostą i skuteczną metodę osiągnięcia tego celu. Poniżej znajduje się przykładowy fragment kodu pokazujący, jak czytać określone obszary obrazów przy użyciu Aspose.OCR dla C++.

Wyodrębnij tekst z określonych obszarów obrazu za pomocą interfejsu API C++

// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;

Wstępne przetwarzanie obrazu przez API C++

Aspose.OCR dla C++ zapewnia ustandaryzowany sposób przygotowania treści do OCR i uzyskania dokładnych wyników OCR. Biblioteka oferuje szereg zaawansowanych technik wstępnego przetwarzania obrazu. Techniki te poprawiają jakość obrazu, korygują zniekształcenia perspektywy, usuwają szumy i optymalizują proces rozpoznawania tekstu. Stosując wstępne przetwarzanie obrazu, programiści mogą znacznie poprawić dokładność rozpoznawania OCR, szczególnie w przypadku trudnych obrazów lub dokumentów o złożonym układzie. Do tego samego obrazu można zastosować wiele filtrów wstępnego przetwarzania, aby jeszcze bardziej poprawić jakość rozpoznawania.

Automatycznie usuwaj szumy z obrazu przed rozpoznaniem za pomocą interfejsu API C++

 // Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;

// apply Preprocessing filter

std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);

Zapisz wyniki rozpoznawania w innych formatach

Aspose.OCR dla C++ umożliwia twórcom oprogramowania rozpoznawanie tekstu z wielu popularnych formatów plików, takich jak PDF, JPEG, PNG, TIFF, BMP i innych. Interfejs API umożliwia programistom zapisywanie wyników rozpoznawania w wielu formatach, dzięki czemu można je udostępniać, przechowywać w bazie danych, wyświetlać lub analizować. Twórcy oprogramowania mogą zapisywać wyniki rozpoznawania jako plik, tekst, JSON lub XML. Biblioteka umożliwia ustawienie progów pewności rozpoznawania, umożliwiając twórcom oprogramowania filtrowanie tekstu o niskim poziomie pewności. Ta funkcja okazuje się nieoceniona w przypadku dużych ilości tekstu, zapewniając, że wydobywane są tylko wiarygodne i dokładne wyniki. Poniższe przykłady pokazują, jak zapisać wyniki rozpoznawania jako plik przy użyciu poleceń C++.

Zapisz wyniki rozpoznawania jako dokument wielostronicowy za pośrednictwem interfejsu API C++

directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);