1. מוצרים
  2.   OCR
  3.   Java
  4.   Asprise OCR SDK for Java
 
  

ספריית Java קוד פתוח לעיבוד טקסט ותמונות OCR

ספריית Java בחינם מובילה המאפשרת למפתחי תוכנה להוסיף יכולות OCR לאפליקציות Java ולבצע OCR על תמונות סרוקות וקבצי PDF כדי לחלץ מהם טקסט בקלות.

Asprise OCR SDK עבור Java הוא קוד פתוח Java SDK רב עוצמה המספק את היכולת לבצע זיהוי תווים אופטי (OCR) על תמונות סרוקות, קבצי PDF ומסמכים אחרים. עם Java API הקל לשימוש שלו, SDK זה יכול לעזור למפתחים להוסיף יכולות OCR ליישומי Java שלהם במהירות ובקלות. OCR היא טכנולוגיה שימושית מאוד המאפשרת למחשבים לזהות טקסט בתמונות או במסמכים. ניתן להשתמש בתוכנת OCR כדי להמיר תמונות סרוקות של טקסט לטקסט דיגיטלי שניתן לערוך, לחפש או לעבד על ידי מחשב.

ה-SDK של Asprise OCR כלל מספר תכונות חשובות לטיפול בפעילויות הקשורות ל-OCR, כגון עיבוד OCR מהיר, תמיכה במספר שפות, מתקן לשיפור תמונה, טקסט מזוהה במגוון פורמטים ועוד רבים. ה-SDK מבוסס על טכנולוגיית OCR מתקדמת שיכולה לזהות טקסט במגוון רחב של גופנים ושפות. ניתן להשתמש בספרייה לפיתוח יישומים ליישומי Java, יישומי אינטרנט, רכיבי Swing/JavaFX ויישומי JEE ארגוניים.

Asprise OCR SDK מאפשר למפתחי תוכנה להפיק טקסט מזוהה במגוון פורמטים, כולל טקסט רגיל, PDF שניתן לחיפוש ו-Microsoft Word. ה-SDK יכול לזהות טקסט בלמעלה מ-100 שפות, כולל אנגלית, סינית, יפנית, ערבית ועוד רבות אחרות. עם טכנולוגיית OCR מתקדמת, תמיכת שפה מקיפה ו-API קל לשימוש, SDK זה יכול לעזור למפתחים לחסוך זמן ומאמץ בעת בניית יישומי OCR.

Previous Next

תחילת העבודה עם Asprise OCR SDK עבור Java

תחילת העבודה עם Asprise OCR SDK עבור Java הדרך המומלצת להתקנת Asprise OCR SDK עבור Java היא באמצעות Maven. אנא השתמש בפקודה הבאה להתקנה חלקה.

Maven Dependency עבור Asprise OCR SDK עבור Java


<dependencies>
	<dependency>
	<groupId>com.asprise.ocr</groupId>
	<artifactId>java-ocr-api;/artifactId>
	<version>[15,)</version>
    </dependency>
</dependencies>

התקן את Asprise OCR SDK עבור Java באמצעות GitHub

 git clone https://github.com/Asprise/java-.net-ocr-api-library  

חלץ טקסט בפורמט טקסט רגיל באמצעות Java

Asprise OCR SDK עבור Java סיפקה פונקציונליות מלאה לחילוץ טקסט מתמונות בפורמט טקסט רגיל. הספרייה מאפשרת למשתמשים לאחזר בקלות את תוכן הטקסט של מסמכים או תמונות סרוקות, ולהשתמש בו להמשך עיבוד או ניתוח. כדי להשיג את משימת חילוץ הטקסט הפשוט, תחילה עליך לטעון את התמונה מקובץ, זרם קלט או כתובת אתר ולהחיל זיהוי OCR על התמונה הנטענת באמצעות ה-API. השתמש בפונקציה המתאימה כדי לאחזר את הטקסט המוכר בפורמט טקסט רגיל. להלן נראה כיצד לטעון תמונה, וטקסט מזוהה כטקסט רגיל, והתוצאה מודפסת למסוף.

טען תמונה וטקסט מזוהה באמצעות Java API

import com.asprise.ocr.Ocr;

public class OCRTest {

    public static void main(String[] args) throws Exception {
        
        // Load image from file
        Ocr ocr = new Ocr();
        ocr.startEngine("eng", Ocr.SPEED_FASTEST);
        String recognizedText = ocr.recognize(new File("image.png"), Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

        // Print the plain text output
        System.out.println("Recognized Text: " + recognizedText);

        ocr.stopEngine();
    }
}

בצע פעולות OCR שונות באפליקציות Java

Asprise OCR SDK עבור Java API מאפשר למפתחי תוכנה לבצע פעולות OCR שונות (זיהוי תווים אופטי) על סוגים שונים של מסמכים. הספרייה תומכת באופן מלא בסוגים שונים של פעולות OCR, כגון OCR Image Files, OCR PDF Files, OCR Written Text, OCR Multiple Languages, לבצע OCR על חלק מהתמונה, לבצע OCR על מספר קבצי קלט בצילום אחד, לבצע OCR ב- עמוד מסוים מקובץ ה-TIFF שצוין, עיבוד אצווה OCR ועוד רבים. הספרייה מספקת כלי רב עוצמה וגמיש לביצוע פעולות OCR בסוגים שונים של מסמכים. עם התמיכה שלו במספר שפות, קבצי תמונה ו-PDF, טקסט בכתב יד ועיבוד אצווה, אתה יכול לחלץ טקסט מהמסמכים שלך במהירות ובדייקנות.

בצע OCR על מספר קבצים באמצעות ספריית Java

String s = ocr.recognize("test.png;test2.jpg", -1, 0, 0, 400, 200,
   Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

perform OCR on a PDF input file:
String s = ocr.recognize("test.pdf", -1, 100, 100, 400, 200,
   Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

תמיכה בריבוי פתילים באמצעות Asprise OCR

Asprise OCR SDK עבור Java API כללה תמיכה מלאה בריבוי השרשורים, המאפשרת למפתחים לעבד משימות OCR מרובות בו-זמנית. תכונה זו מאפשרת למפתחים לשפר את הביצועים של יישומי ה-OCR שלהם על ידי הפצת עיבוד OCR על פני שרשורים מרובים, שיכולים לפעול במקביל על מספר ליבות או מעבדים. התמיכה בריבוי השחלים ניתנת להתאמה אישית רבה, ומאפשרת למפתחים לכוונן עדין את מספר השרשורים ומנועי OCR כך שיתאימו למשאבים הזמינים ולדרישות העיבוד. במידה רבה, התמיכה בריבוי השחלות של Asprise OCR SDK for Java מספקת למפתחים כלי רב עוצמה וגמיש לבניית יישומי OCR בעלי ביצועים גבוהים שיכולים לעבד כמויות גדולות של טקסט במהירות וביעילות.

כתיבת קוד ניהול שרשור מסובך

OcrExecutorService oes =
  new OcrExecutorService("eng", Ocr.SPEED_FASTEST, 4); // 4 threads

List> futures = oes.invokeAll(Arrays.asList(
  new OcrExecutorService.OcrCallable(
    new File[] {new File("test1.png")},
      Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML),
  new OcrExecutorService.OcrCallable(
    new File[] {new File("test2.png")},
      Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML)
);

System.out.println("Result of test1.png: " + futures.get(0).get());
System.out.println("Result of test2.png: " + futures.get(1).get());

oes.shutdown(); // stops all OCR engines and disposes all threads
 עִברִית