1. محصولات
  2.   OCR
  3.   Java
  4.   Asprise OCR SDK for Java
 
  

کتابخانه جاوا منبع باز برای پردازش متن و تصویر OCR

یک کتابخانه رایگان جاوا پیشرو که به توسعه دهندگان نرم افزار اجازه می دهد تا قابلیت های OCR را به برنامه های جاوا اضافه کنند و OCR را روی تصاویر اسکن شده و فایل های PDF انجام دهند تا متن را به راحتی از آنها استخراج کنند.

Asprise OCR SDK برای جاوا یک جاوا SDK منبع باز قدرتمند است که قابلیت تشخیص نویسه نوری (OCR) را بر روی تصاویر اسکن شده، فایل های PDF و سایر اسناد فراهم می کند. با استفاده آسان جاوا API، این SDK می تواند به توسعه دهندگان کمک کند قابلیت های OCR را به سرعت و به راحتی به برنامه های جاوا خود اضافه کنند. OCR یک فناوری بسیار مفید است که رایانه ها را قادر می سازد متن را در تصاویر یا اسناد تشخیص دهند. از نرم افزار OCR می توان برای تبدیل تصاویر اسکن شده متن به متن دیجیتالی استفاده کرد که می تواند توسط رایانه ویرایش، جستجو یا پردازش شود.

Asprise OCR SDK دارای چندین ویژگی مهم برای مدیریت فعالیت‌های مربوط به OCR است، مانند پردازش سریع OCR، پشتیبانی از چندین زبان، تسهیلات بهبود تصویر، متن شناسایی شده در قالب‌های مختلف و بسیاری موارد دیگر. SDK مبتنی بر فناوری پیشرفته OCR است که می تواند متن را در فونت ها و زبان های مختلف تشخیص دهد. از این کتابخانه می توان برای توسعه برنامه های کاربردی برای اپلت های جاوا، برنامه های کاربردی وب، اجزای Swing/JavaFX و برنامه های کاربردی JEE استفاده کرد.

Asprise OCR SDK به توسعه دهندگان نرم افزار اجازه می دهد تا متن شناسایی شده را در قالب های مختلف، از جمله متن ساده، PDF قابل جستجو، و Microsoft Word خروجی بگیرند. SDK می تواند متن را به بیش از 100 زبان از جمله انگلیسی، چینی، ژاپنی، عربی و بسیاری دیگر تشخیص دهد. این SDK با فناوری پیشرفته OCR، پشتیبانی زبان جامع و API با استفاده آسان، می‌تواند به توسعه‌دهندگان کمک کند هنگام ساخت برنامه‌های OCR در زمان و تلاش صرفه‌جویی کنند.

Previous Next

شروع به کار با Asprise OCR SDK برای جاوا

شروع با Asprise OCR SDK برای جاوا روش توصیه شده برای نصب Asprise OCR SDK برای جاوا استفاده از Maven است. لطفا از دستور زیر برای نصب راحت استفاده کنید.

وابستگی Maven برای Asprise OCR SDK برای جاوا


<dependencies>
	<dependency>
	<groupId>com.asprise.ocr</groupId>
	<artifactId>java-ocr-api;/artifactId>
	<version>[15,)</version>
    </dependency>
</dependencies>

Asprise OCR SDK را برای جاوا از طریق GitHub نصب کنید

 git clone https://github.com/Asprise/java-.net-ocr-api-library  

استخراج متن در قالب متن ساده از طریق جاوا

Asprise OCR SDK برای جاوا عملکرد کاملی را برای استخراج متن از تصاویر در قالب متن ساده ارائه کرده است. این کتابخانه به کاربران اجازه می دهد تا محتوای متنی اسناد یا تصاویر اسکن شده را به راحتی بازیابی کنند و از آن برای پردازش یا تجزیه و تحلیل بیشتر استفاده کنند. برای دستیابی به وظیفه استخراج متن ساده، ابتدا باید تصویر را از یک فایل، جریان ورودی یا URL بارگیری کنید و با استفاده از API، تشخیص OCR را روی تصویر بارگذاری شده اعمال کنید. از تابع مناسب برای بازیابی متن شناسایی شده در قالب متن ساده استفاده کنید. در زیر نحوه بارگذاری یک تصویر و متن شناسایی شده به عنوان متن ساده نشان داده می شود و نتیجه در کنسول چاپ می شود.

بارگیری تصویر، و متن شناسایی شده از طریق Java API

import com.asprise.ocr.Ocr;

public class OCRTest {

    public static void main(String[] args) throws Exception {
        
        // Load image from file
        Ocr ocr = new Ocr();
        ocr.startEngine("eng", Ocr.SPEED_FASTEST);
        String recognizedText = ocr.recognize(new File("image.png"), Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

        // Print the plain text output
        System.out.println("Recognized Text: " + recognizedText);

        ocr.stopEngine();
    }
}

انجام عملیات OCR مختلف در برنامه های جاوا

Asprise OCR SDK for Java API به توسعه دهندگان نرم افزار اجازه می دهد تا عملیات OCR (تشخیص نویسه نوری) را بر روی انواع مختلف اسناد انجام دهند. این کتابخانه به طور کامل از انواع مختلف عملیات OCR پشتیبانی می کند، مانند OCR Image Files، OCR PDF Files، OCR Handwritten Text، OCR Multiple Languages، انجام OCR در بخشی از تصویر، انجام OCR روی چندین فایل ورودی در یک شات، انجام OCR در یک عکس. صفحه خاصی از فایل TIFF مشخص شده، OCR Batch Processing و بسیاری موارد دیگر. این کتابخانه ابزار قدرتمند و انعطاف پذیری را برای انجام عملیات OCR بر روی انواع مختلف اسناد فراهم می کند. با پشتیبانی از چندین زبان، تصویر و فایل‌های PDF، متن دست‌نویس و پردازش دسته‌ای، می‌توانید متن را به سرعت و با دقت از اسناد خود استخراج کنید.

اجرای OCR روی چندین فایل از طریق کتابخانه جاوا

String s = ocr.recognize("test.png;test2.jpg", -1, 0, 0, 400, 200,
   Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

perform OCR on a PDF input file:
String s = ocr.recognize("test.pdf", -1, 100, 100, 400, 200,
   Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

پشتیبانی از چند رشته با استفاده از Asprise OCR

Asprise OCR SDK for Java API شامل پشتیبانی کامل از multi-threading است که به توسعه دهندگان امکان می دهد چندین کار OCR را به طور همزمان پردازش کنند. این ویژگی توسعه دهندگان را قادر می سازد تا عملکرد برنامه های OCR خود را با توزیع پردازش OCR در چندین رشته که می توانند همزمان بر روی چندین هسته یا پردازنده اجرا شوند، بهبود بخشند. پشتیبانی از Multi-threading بسیار قابل تنظیم است و به توسعه دهندگان این امکان را می دهد تا تعداد نخ ها و موتورهای OCR را برای مطابقت با منابع موجود و نیازهای پردازش تنظیم کنند. به طور عمده، Asprise OCR SDK برای پشتیبانی چند رشته ای جاوا، ابزاری قدرتمند و انعطاف پذیر برای ساخت برنامه های OCR با کارایی بالا در اختیار توسعه دهندگان قرار می دهد که می توانند حجم زیادی از متن را به سرعت و کارآمد پردازش کنند.

نوشتن کد مدیریت رشته پیچیده

OcrExecutorService oes =
  new OcrExecutorService("eng", Ocr.SPEED_FASTEST, 4); // 4 threads

List> futures = oes.invokeAll(Arrays.asList(
  new OcrExecutorService.OcrCallable(
    new File[] {new File("test1.png")},
      Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML),
  new OcrExecutorService.OcrCallable(
    new File[] {new File("test2.png")},
      Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML)
);

System.out.println("Result of test1.png: " + futures.get(0).get());
System.out.println("Result of test2.png: " + futures.get(1).get());

oes.shutdown(); // stops all OCR engines and disposes all threads
 فارسی