Aspose.OCR for C++

C++ OCR API להוספת יכולות OCR

שלב פונקציונליות OCR בתוך אפליקציות C & C++ באמצעות API OCR בחינם. זה יכול לזהות ולחלץ טקסט מתמונות סרוקות וקובצי PDF, תמונות סמארטפון, צילומי מסך ואזורי תמונות.

ככל שהעידן הדיגיטלי ממשיך להתרחב, הצורך בחילוץ טקסט יעיל מתמונות, מסמכים סרוקים ומקורות אחרים נעשה הכרחי. זה המקום שבו טכנולוגיית זיהוי תווים אופטי (OCR) ממלאת תפקיד חיוני בהמרת נתונים חזותיים לטקסט הניתן לעריכה ולחיפוש. Aspose.OCR עבור C++ מתגלה כפתרון רב עוצמה, המציע למפתחים ערכת כלים מקיפה לשילוב יכולות OCR בצורה חלקה ביישומי C++ שלהם. בין אם מפתחים צריכים לחלץ טקסט ממסמכים סרוקים, תמונות או אפילו צילומי מסך, Aspose.OCR מספק פתרון מקיף לטיפול בדרישות OCR שונות.

Aspose.OCR for C++ מציע קבוצה עשירה של תכונות עיבוד תמונה המשפרות את דיוק ה-OCR ומשפרות את תהליך הזיהוי. ישנם מספר מאפיינים חשובים של הספרייה, כגון תהליכים של תמונות מסובבות ורועשות, זיהוי טקסט במספר רב של שפות, זיהוי אצווה של כל התמונות, זיהוי כל התמונה, חילוץ טקסט מאזורים נבחרים בלבד, זיהוי מילים או פסקאות, שומר את תוצאות הזיהוי בדיסק, תמיכה בעיבוד מקדים של תמונה, מזהה את התווים בתמונה, מזהה תווים בתמונה, קורא רק אזורים מסוימים בתמונה וכן הלאה. מפתחי תוכנה יכולים לעבד תמונות מראש על ידי החלת מסננים, התאמת ניגודיות ובהירות, ביטול הטיה והסרת רעשים, בין היתר.

ניתן לשלב את Aspose.OCR עבור C++ בקלות ביישומי המשתמש וכן במוצרי Aspose אחרים. הספרייה מספקת API פשוט מאוד המאפשר למפתחים לשלב בצורה חלקה יכולות OCR בפרויקטי C++ שלהם. בעזרת מספר שורות קוד בלבד, מפתחים יכולים לאתחל את מנוע ה-OCR, לטעון את התמונה או המסמך ולחלץ את הטקסט. זה נועד להיות חוצה פלטפורמות וניתן להשתמש בו לפיתוח יישומים חוצי פלטפורמות עבור Windows, Linux ואינטרנט. על ידי שילוב Aspose.OCR בפרויקטים שלהם, מפתחי תוכנה יכולים לשפר את הפרודוקטיביות, לשפר את נגישות הנתונים ולפתוח אפשרויות חדשות לעיבוד וניתוח טקסט ביישומים שלהם.

במבט אחד

סקירה כללית של Aspose.OCR עבור תכונות C++.

סקירת תכונות

בצע OCR
הוסף יכולות OCR
זהה טקסט תמונה
המר תמונות של טקסט
טקסט גופן מזוהה
חפש PDF
27 שפות זיהוי
צור אפליקציות OCR
שמור בדפדפן
חלץ טקסט
תמיכה בריבוי-שרשורים

סקירת תכונות

זהה תמונה שסובבה
עיבוד מקדים של מסננים
PDF לתמונות
מזהה תווים צ'ינים
מגלה גופנים פופולריים
מעבד את התמונה השלמה
תמיכה בתמונות מסובבות
זיהוי אצווה
בודק איות מובנה
פיצול PDF
PDF ל-Excel
PDF ל-SVG

Aspose.OCR for C++

API תומך בעיקר בפורמט PDF אך יכול לייצא מסמכי PDF למספר פורמטים אחרים.

קוֹרֵא

PDF, PDF/A, TEX, XPS, SVG

סוֹפֵר

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR for C++

עצמאות פלטפורמה

Aspose.OCR עבור C++ יכול לעבוד עם כל שפת תכנות מבוססת C++.

C++ runtime.

Aspose.OCR for C++

תחילת העבודה עם Aspose.OCR עבור C++

הדרך המומלצת להתקנת Aspose.OCR עבור C++ היא באמצעות NuGet. אנא השתמש בפקודה הבאה להתקנה חלקה.

התקן את Aspose.OCR עבור C++ באמצעות NuGet Command

 NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0

תוכל להוריד את הספרייה ישירות מדף המוצר Aspose.PDF

חילוץ טקסט יעיל באפליקציות C++

Aspose.OCR for C++ מספק גישה אמינה ויעילה לחילוץ טקסט ממגוון רחב של פורמטים של קבצים, כולל מסמכים סרוקים, תמונות, קובצי PDF, TIFF מרובי עמודים, מערך פיקסלים, קבלות וכן הלאה. הוא משתמש באלגוריתמי OCR מתוחכמים כדי לזהות ולחלץ טקסט בדיוק גבוה, תוך שמירה על העיצוב והמבנה המקוריים. הספרייה תומכת במגוון רחב של שפות, מה שהופך אותה למתאימה ליישומים רב לשוניים ומאפשרת למפתחים לחלץ טקסט ממקורות מגוונים ללא מאמץ. הדוגמה הבאה מראה כיצד לחלץ טקסט מתמונת TIFF באמצעות C++ API.

חילוץ טקסט מתמונת TIFF באמצעות C++ API?

std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;

קרא אזורים מסוימים של תמונות באמצעות C++

Aspose.OCR עבור C++ מקל על מפתחי תוכנה לקרוא אזור מסוים בתמונה ולחלץ טקסט מאותם אזורים או אזורים בתוך יישומי C++. תכונה זו שימושית במיוחד כאשר אתה רק צריך לחלץ טקסט מקטעים ספציפיים של תמונה וברצונך לא לכלול תוכן לא רלוונטי. הספרייה מציעה שיטה פשוטה ויעילה להשיג זאת. להלן קטע קוד לדוגמה המדגים כיצד לקרוא אזורים מסוימים של תמונות באמצעות Aspose.OCR עבור C++.

חלץ טקסט מאזורים ספציפיים בתוך תמונה באמצעות C++ API

// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;

עיבוד מקדים של תמונה באמצעות API של C++

Aspose.OCR for C++ סיפקה דרך סטנדרטית להכין את התוכן שלך ל-OCR ולהשיג תוצאות OCR מדויקות. הספרייה מציעה מגוון טכניקות מתקדמות של עיבוד מקדים של תמונה. טכניקות אלו משפרות את איכות התמונה, מתקנים עיוות פרספקטיבה, מסירים רעשים ומייעלים את תהליך זיהוי הטקסט. על ידי שימוש בעיבוד מקדים של תמונה, מפתחים יכולים לשפר משמעותית את דיוק ה-OCR, במיוחד כאשר הם מתמודדים עם תמונות מאתגרות או מסמכים עם פריסות מורכבות. ניתן להחיל מסנני עיבוד מוקדם מרובים על אותה תמונה כדי לשפר עוד יותר את איכות הזיהוי.

הסר רעש מתמונה באופן אוטומטי לפני זיהוי באמצעות C++ API

 // Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;

// apply Preprocessing filter

std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);

שמור תוצאות זיהוי בפורמטים אחרים

Aspose.OCR for C++ מאפשר למפתחי תוכנה לזהות טקסט ממספר פורמטים פופולריים של קבצים, כגון PDF, JPEG, PNG, TIFF, BMP ועוד. ה-API מאפשר למפתחים לשמור תוצאות זיהוי במספר פורמטים כך שניתן יהיה לשתף אותן, לאחסן אותן במסד נתונים, להציגן או לנתח אותן. מפתחי תוכנה יכולים לשמור תוצאות זיהוי כקובץ, טקסט, JSON או XML. הספרייה מאפשרת להגדיר ספי ביטחון זיהוי, המאפשרת למפתחי תוכנה לסנן טקסט ברמות ביטחון נמוכות. תכונה זו מתגלה כבעלת ערך רב בעת התמודדות עם כמויות גדולות של טקסט, ומבטיחה שרק תוצאות אמינות ומדויקות יחולצו. הדוגמאות הבאות מראות כיצד לשמור תוצאות זיהוי כקובץ באמצעות פקודות C++.

שמור תוצאות זיהוי כמסמך מרובה עמודים באמצעות API של C++

directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);