קוד פתוח C# .NET API לזיהוי טקסט OCR מהיר יותר
C# .NET API לזיהוי תווים אופטי (OCR) בחינם לזיהוי טקסט מהיר יותר מתמונות, כולל מסמכים סרוקים, קובצי PDF מרובי עמודים ותמונות.
זיהוי תווים אופטי (OCR) היא טכנולוגיה שימושית מאוד המאפשרת למכונות לקרוא טקסט מתמונות כמו גם מסמכים ולהמיר אותו לטקסט קריא במכונה. בתקופה האחרונה, OCR הפך יותר ויותר פופולרי עקב עליית הדיגיטליזציה והצורך בעיבוד נתונים אוטומטי. ישנם ממשקי API רבים של OCR זמינים שמפתחים יכולים להשתמש בהם כדי ליישם OCR באפליקציות שלהם. API אחד כזה הוא Free-OCR-API-CSharp, שהוא ממשק API חינמי של OCR שעוזר למפתחי תוכנה ליצור יישומי NET לטיפול בפעולות OCR. ה-API הוא חינמי לחלוטין לשימוש ואינו דורש דמי רישום או מנוי.
Free-OCR-API-CSharp הוא API OCR חינמי המאפשר למתכנתי תוכנה לשלב פונקציונליות OCR ביישומי C# שלהם ללא תלות חיצונית. ה-API משתמש בטכנולוגיית OCR מתקדמת המאפשרת זיהוי של טקסט מתמונות, כולל מסמכים סרוקים, קובצי PDF ותמונות. ה-API תומך במספר שפות ויכול לזהות טקסט בסגנונות וגדלים שונים של גופנים. ה-API תומך במספר שפות, כולל אנגלית, צרפתית, גרמנית, איטלקית, פורטוגזית וספרדית. טכנולוגיית ה-OCR המשמשת את ה-API היא מהירה ומדויקת, ומאפשרת זיהוי טקסט מהיר ויעיל. בסך הכל זוהי בחירה מצוינת עבור מפתחי תוכנה להוסיף פונקציונליות OCR מתקדמת בתוך יישומי C# שלהם בקלות.
תחילת העבודה עם Free-OCR-API-CSharp
הדרך המומלצת להתקנת Free-OCR-API-CSharp היא באמצעות NuGet. אנא השתמש בפקודה הבאה להתקנה חלקה.
התקן את Free-OCR-API-CSharp דרך NuGet
Install-Package Free-OCR-API-CSharp
אתה יכול גם להתקין אותו באופן ידני; הורד את קבצי הגרסה העדכניים ביותר ישירות ממאגר GitHub.
זהה טקסט מתמונות באמצעות C# OCR API
ה-API בקוד פתוח Free-OCR-API-CSharp כלל תמיכה בתכונה מצוינת לזיהוי טקסט מסוגים שונים של תמונות בשפות שונות בתוך יישומי NET. כדי להשיג את המשימה מפתחי תוכנות רק צריכים לטעון את התמונה שלהם לתוך מערך בתים ולהתקשר לשיטת ה-OCR של מופע FreeOcrApi, תוך מעבר במערך בתים ושפת הטקסט לזיהוי. הספרייה מספקת גם תכונה מצוינת לזיהוי טקסט ממספר קבצים בו-זמנית, מה שמקל על עיבוד קבצים רבים בו-זמנית. הדוגמה הבאה מראה כיצד לזהות טקסט מתמונות באמצעות קוד C# .NET.
כיצד לזהות טקסט מתמונות באמצעות API של C#?
using System;
using System.IO;
using FreeOcrApi;
var ocr = new FreeOcrApi("your-api-key");
// Load your image file into a byte array:
byte[] imageData = File.ReadAllBytes("path-to-your-image-file");
string recognizedText = ocr.OCR(imageData, "eng");
// Finally, display the recognized text in the console or save it to a file:
Console.WriteLine(recognizedText);
File.WriteAllText("path-to-output-file", recognizedText);
צור קובץ PDF שניתן לחיפוש באמצעות API של C#
ה-API בקוד פתוח Free-OCR-API-CSharp מאפשר למפתחי תוכנה ליצור קובצי PDF הניתנים לחיפוש (הידועים גם כקובצי PDF של Sandwich) ישירות בתוך יישומי C# שלהם. כברירת מחדל, שכבת הטקסט הנוספת גלויה, מה שנותן למשתמשים הזדמנות מצוינת לבחון את התוצאה מכיוון שהם יכולים להשוות את הפלט המופיע ב-OCR ישירות עם תמונת הסריקה. הדוגמה הבאה מדגימה כיצד מפתחי תוכנה יכולים לטעון תמונה ולהמיר אותה למסמכי חיפוש PDF באמצעות קוד C#.
כיצד ליצור PDF שניתן לחיפוש באמצעות C# API?
using System.IO;
using FreeOcrApi;
using PdfSharpCore.Drawing;
using PdfSharpCore.Pdf;
namespace ConsoleApp
{
class Program
{
static void Main(string[] args)
{
FreeOcrApiWrapper api = new FreeOcrApiWrapper("YOUR_API_KEY");
MemoryStream imageStream = new MemoryStream(File.ReadAllBytes("path/to/image.jpg"));
string text = api.Recognize(imageStream);
PdfDocument pdf = new PdfDocument();
PdfPage page = pdf.AddPage();
XGraphics gfx = XGraphics.FromPdfPage(page);
XFont font = new XFont("Verdana", 12, XFontStyle.Regular);
gfx.DrawString(text, font, XBrushes.Black, new XRect(0, 0, page.Width, page.Height), XStringFormats.TopLeft);
pdf.Save("path/to/output.pdf");
}
}
}