Aspose.OCR for Java
Java OCR API מוביל להוספת פעולות זיהוי תווים אופטיים
ממשקי API מובילים של Java מאפשרים לבנות אפליקציה עם יכולות זיהוי תווים אופטי (OCR). קרא, זהה טקסט ממסמכים סרוקים, תמונות וקבצים אחרים באמצעות ספריית Java.
Aspose.OCR עבור Java הוא מנוע OCR (Optical Character Recognition) מוביל המעניק למפתחי תוכנה את היכולת לשלב פונקציונליות של זיהוי טקסט ביישומי Java שלהם. זה תוכנן להיות פשוט מאוד לטיפול ומאפשר למפתחי תוכנה לזהות טקסט ממסמכים סרוקים, תמונות ומקורות אחרים, וניתן להשתמש בו כדי לחלץ טקסט מפורמטים שונים של קבצים, כולל JPEG, PNG, BMP, TIFF, HTML, PDF ועוד רבים אחרים.
Aspose.OCR עבור Java משתמש באלגוריתמי OCR מתקדמים כדי לזהות במדויק טקסט מתמונות, אפילו בסריקות או צילומים באיכות נמוכה. הוא כלל תמיכה בלמעלה מ-50 שפות שונות, כולל אנגלית, ספרדית, צרפתית, גרמנית, סינית ועוד. ישנן מספר תכונות חשובות של הספרייה כגון זיהוי טקסט בכתב יד, חילוץ טקסט מצילומי מסך, חילוץ טקסט מאזורים ספציפיים בתמונה, יצירת קובצי PDF הניתנים לחיפוש, תמיכה בתמונות סמארטפון, תמיכה בהסרת רעשים, תמיכה בבינאריזציה של תמונות, נגישות מוגברת ועוד רבים. יותר.
Aspose.OCR עבור Java משתמש באלגוריתמי OCR מתקדמים שיכולים לזהות במדויק טקסט מתמונות, אפילו בסריקות או צילומים באיכות נמוכה. הספרייה יכולה לשפר את הנגישות למשתמשים על ידי המרת מסמכים סרוקים למסמכים דיגיטליים הניתנים לחיפוש בקלות. עם אלגוריתמי OCR מתקדמים, תמיכה בריבוי שפות ושילוב קל, Aspose.OCR עבור Java הופכת במהירות לתוכנת ה-OCR המומלצת עבור מפתחים המעוניינים להוסיף פונקציונליות OCR ליישומי Java שלהם.
תחילת העבודה עם Aspose.OCR עבור Java
הדרך המומלצת להתקנת Aspose.OCR עבור Java היא באמצעות Maven Repository. אנא השתמש בפקודה הבאה להתקנה חלקה.
התקן את Aspose.OCR עבור Java דרך Maven Repository
<repositories>
<repository>
<Id>AsposeJavaAPI</Id>
<name>Aspose Java API;/name>
<url>http://repository.aspose.com/repo/</url>
</repository>
</repositories>
תוכל להוריד את הספרייה ישירות מדף המוצר Aspose.OCR
חלץ טקסט מתמונות באמצעות Python API
Aspose.OCR עבור Java כללה תכונות שימושיות מאוד המאפשרות למפתחי תוכנה לחלץ טקסט מסוגים שונים של תמונות בתוך יישומי Python. הספרייה כללה תמיכה בקריאת טקסט מתמונות רסטר כגון JPEG, PNG, WBMP, BMP, GIF ועוד רבים. ישנן תכונות שימושיות נוספות חלק מהספרייה לטיפול בחילוץ טקסט כגון קריאת טקסט מתמונות TIFF מרובות עמודים, חילוץ טקסט ממערך הפיקסלים, קריאת תמונות במצב הזיהוי המהיר ביותר, זיהוי שורה בודדת, חילוץ טקסט מקבלות ועוד רבים. הדוגמה הבאה מראה כיצד לחלץ טקסט מתמונה באמצעות פקודות Java.
כיצד לחלץ טקסט מתמונה באמצעות Java API?
AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();
קרא אזורים ספציפיים של תמונה באמצעות Java API
Aspose.OCR עבור Java היא ספריית OCR שימושית המאפשרת למפתחי תוכנה למצוא ולקרוא רק אזורים מסוימים בתמונה, לא כל טקסט באמצעות כמה שורות של קוד Java. זוהי תכונה שימושית מאוד ויכולה לעזור מאוד בעיבוד אצווה עבור מסמכים אחידים כמו ויזות, רישיונות נהיגה, תעודות זהות וכו'. הוא תומך בתכונות כמו חילוץ טקסט בתוך מלבן תמונה, חילוץ קווים עם קואורדינטות, חיפוש אוטומטי של תיבות תוחמות מילים ושורות ועוד רבים נוספים. הדוגמה הבאה מראה כיצד לחלץ טקסט בתוך מלבן באמצעות קוד Java.
כיצד לחלץ טקסט בתוך מלבן באמצעות Java API?
AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));
בחר אזורים ספציפיים למסמך באמצעות Java API
תמונת מסמך עשויה להכיל בלוקים רבים של תכנים שונים כגון פסקאות טקסט, שרטוטים, דיאגרמות, נוסחאות, טבלאות, מפות וכן הלאה. Aspose.OCR עבור Java מאפשר למפתחי תוכנה לבחור ולזהות תחומי עניין מסוימים בדף בקלות ולבצע בו פעולת OCR. הספרייה תומכת בזיהוי אזורים אוטומטי, כמו גם שאתה יכול לעקוף אותו על ידי בחירה ידנית של אזורי עניין. הדוגמה הבאה הדגימה כיצד מפתחי תוכנה יכולים לאפשר זיהוי אוטומטי של אזורי מסמכים בתוך יישומי Java שלהם.
זיהוי אזורי מסמכים אוטומטי באמצעות Java API
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");