Aspose.OCR for C++
API OCR C++ để thêm khả năng OCR
Tích hợp chức năng OCR vào các ứng dụng C & C++ bằng API OCR miễn phí. Nó có thể nhận dạng và trích xuất văn bản từ hình ảnh được quét & PDF, ảnh điện thoại thông minh, ảnh chụp màn hình và các vùng hình ảnh.
Khi kỷ nguyên số tiếp tục mở rộng, nhu cầu trích xuất văn bản hiệu quả từ hình ảnh, tài liệu được quét và các nguồn khác trở nên cần thiết. Đây là lúc công nghệ nhận dạng ký tự quang học (OCR) đóng vai trò quan trọng trong việc chuyển đổi dữ liệu trực quan thành văn bản có thể chỉnh sửa và tìm kiếm được. Aspose.OCR cho C++ nổi lên như một giải pháp mạnh mẽ, cung cấp cho các nhà phát triển một bộ công cụ toàn diện để tích hợp các chức năng OCR một cách liền mạch vào các ứng dụng C++ của họ. Cho dù các nhà phát triển cần trích xuất văn bản từ tài liệu được quét, hình ảnh hay thậm chí là ảnh chụp màn hình, Aspose.OCR đều cung cấp một giải pháp toàn diện để xử lý nhiều yêu cầu OCR khác nhau.
Aspose.OCR cho C++ cung cấp một bộ tính năng xử lý hình ảnh phong phú giúp tăng cường độ chính xác của OCR và cải thiện quy trình nhận dạng. Thư viện có một số tính năng quan trọng, chẳng hạn như xử lý hình ảnh bị xoay và nhiễu, nhận dạng văn bản bằng nhiều ngôn ngữ, nhận dạng hàng loạt tất cả hình ảnh, nhận dạng toàn bộ hình ảnh, chỉ trích xuất văn bản từ các vùng đã chọn, nhận dạng từ hoặc đoạn văn, lưu kết quả nhận dạng trên đĩa, hỗ trợ xử lý trước hình ảnh, Nhận dạng ký tự trên hình ảnh, Nhận dạng ký tự trên hình ảnh, chỉ đọc một số vùng nhất định của hình ảnh, v.v. Các nhà phát triển phần mềm có thể xử lý trước hình ảnh bằng cách áp dụng bộ lọc, điều chỉnh độ tương phản và độ sáng, làm lệch hướng và loại bỏ nhiễu, cùng với các thao tác khác.
Aspose.OCR cho C++ có thể dễ dàng tích hợp vào các ứng dụng của người dùng cũng như với các sản phẩm Aspose khác. Thư viện cung cấp một API rất đơn giản cho phép các nhà phát triển kết hợp liền mạch các khả năng OCR vào các dự án C++ của họ. Chỉ với một vài dòng mã, các nhà phát triển có thể khởi tạo công cụ OCR, tải hình ảnh hoặc tài liệu và trích xuất văn bản. Nó được thiết kế để đa nền tảng và có thể được sử dụng để phát triển các ứng dụng đa nền tảng cho Windows, Linux và web. Bằng cách tích hợp Aspose.OCR vào các dự án của mình, các nhà phát triển phần mềm có thể nâng cao năng suất, cải thiện khả năng truy cập dữ liệu và mở ra những khả năng mới để xử lý và phân tích văn bản trong các ứng dụng của họ.
Bắt đầu với Aspose.OCR cho C++
Cách được khuyến nghị để cài đặt Aspose.OCR cho C++ là sử dụng NuGet. Vui lòng sử dụng lệnh sau để cài đặt suôn sẻ.
Cài đặt Aspose.OCR cho C++ thông qua lệnh NuGet
NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0
Bạn có thể tải xuống thư viện trực tiếp từ trang sản phẩm Aspose.PDF
Trích xuất văn bản hiệu quả trong ứng dụng C++
Aspose.OCR cho C++ cung cấp phương pháp đáng tin cậy và hiệu quả để trích xuất văn bản từ nhiều định dạng tệp khác nhau, bao gồm tài liệu được quét, hình ảnh, tệp PDF, TIFF nhiều trang, mảng pixel, biên lai, v.v. Thư viện này sử dụng các thuật toán OCR tinh vi để nhận dạng và trích xuất văn bản với độ chính xác cao, đồng thời giữ nguyên định dạng và cấu trúc ban đầu. Thư viện hỗ trợ nhiều ngôn ngữ, phù hợp với các ứng dụng đa ngôn ngữ và cho phép các nhà phát triển trích xuất văn bản từ nhiều nguồn khác nhau một cách dễ dàng. Ví dụ sau đây cho thấy cách trích xuất văn bản từ hình ảnh TIFF thông qua API C++.
Trích xuất văn bản từ hình ảnh TIFF thông qua API C++?
std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;
Đọc một số vùng nhất định của hình ảnh thông qua C++
Aspose.OCR cho C++ giúp các nhà phát triển phần mềm dễ dàng đọc một vùng cụ thể của hình ảnh và trích xuất văn bản từ các vùng hoặc khu vực đó bên trong các ứng dụng C++. Tính năng này đặc biệt hữu ích khi bạn chỉ cần trích xuất văn bản từ các phần cụ thể của hình ảnh và muốn loại trừ nội dung không liên quan. Thư viện cung cấp một phương pháp đơn giản và hiệu quả để thực hiện điều này. Dưới đây là một đoạn mã mẫu minh họa cách đọc một số vùng nhất định của hình ảnh bằng Aspose.OCR cho C++.
Trích xuất văn bản từ các vùng cụ thể trong hình ảnh thông qua API C++
// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;
Xử lý hình ảnh trước qua API C++
Aspose.OCR cho C++ đã cung cấp một cách chuẩn hóa để chuẩn bị nội dung của bạn cho OCR và đạt được kết quả OCR chính xác. Thư viện cung cấp một loạt các kỹ thuật xử lý hình ảnh trước tiên tiến. Các kỹ thuật này nâng cao chất lượng hình ảnh, hiệu chỉnh độ méo phối cảnh, loại bỏ nhiễu và tối ưu hóa quy trình nhận dạng văn bản. Bằng cách sử dụng xử lý hình ảnh trước, các nhà phát triển có thể cải thiện đáng kể độ chính xác của OCR, đặc biệt là khi xử lý hình ảnh hoặc tài liệu khó với bố cục phức tạp. Nhiều bộ lọc xử lý trước có thể được áp dụng cho cùng một hình ảnh để cải thiện thêm chất lượng nhận dạng.
Tự động loại bỏ nhiễu khỏi hình ảnh trước khi nhận dạng thông qua API C++
// Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;
// apply Preprocessing filter
std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);
Lưu kết quả nhận dạng ở các định dạng khác
Aspose.OCR cho C++ cho phép các nhà phát triển phần mềm nhận dạng văn bản từ nhiều định dạng tệp phổ biến, chẳng hạn như PDF, JPEG, PNG, TIFF, BMP, v.v. API cho phép các nhà phát triển lưu kết quả nhận dạng ở nhiều định dạng để có thể chia sẻ, lưu trữ trong cơ sở dữ liệu, hiển thị hoặc phân tích. Các nhà phát triển phần mềm có thể lưu kết quả nhận dạng dưới dạng tệp, văn bản, JSON hoặc XML. Thư viện cho phép thiết lập ngưỡng độ tin cậy nhận dạng, cho phép các nhà phát triển phần mềm lọc ra văn bản có mức độ tin cậy thấp. Tính năng này tỏ ra vô cùng hữu ích khi xử lý khối lượng lớn văn bản, đảm bảo chỉ trích xuất được các kết quả đáng tin cậy và chính xác. Các ví dụ sau đây cho thấy cách lưu kết quả nhận dạng dưới dạng tệp bằng lệnh C++.
Lưu kết quả nhận dạng dưới dạng tài liệu nhiều trang thông qua API C++
directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);