1. Продукти
  2.   OCR
  3.   Java
  4.   Asprise OCR SDK for Java
 
  

Java библиотека с отворен код за OCR обработка на текст и изображения

Водеща безплатна Java библиотека, която позволява на разработчиците на софтуер да добавят OCR възможности към Java приложения и да извършват OCR върху сканирани изображения и PDF файлове, за да извличат текст от тях с лекота.

Asprise OCR SDK за Java е мощен Java SDK с отворен код, който предоставя възможност за извършване на оптично разпознаване на знаци (OCR) върху сканирани изображения, PDF файлове и други документи. Със своя лесен за използване Java API, този SDK може да помогне на разработчиците да добавят OCR възможности към своите Java приложения бързо и лесно. OCR е много полезна технология, която позволява на компютрите да разпознават текст в изображения или документи. OCR софтуерът може да се използва за преобразуване на сканирани изображения на текст в цифров текст, който може да се редактира, търси или обработва от компютър.

Asprise OCR SDK включва няколко важни функции за обработка на дейности, свързани с OCR, като бърза OCR обработка, поддръжка на няколко езика, възможност за подобряване на изображението, разпознат текст в различни формати и много други. SDK е базиран на усъвършенствана OCR технология, която може да разпознава текст в голямо разнообразие от шрифтове и езици. Библиотеката може да се използва за разработване на приложения за Java аплети, уеб приложения, Swing/JavaFX компоненти и JEE корпоративни приложения.

Asprise OCR SDK позволява на разработчиците на софтуер да извеждат разпознат текст в различни формати, включително обикновен текст, PDF с възможност за търсене и Microsoft Word. SDK може да разпознава текст на над 100 езика, включително английски, китайски, японски, арабски и много други. Със своята усъвършенствана OCR технология, цялостна езикова поддръжка и лесен за използване API, този SDK може да помогне на разработчиците да спестят време и усилия при изграждане на OCR приложения.

Previous Next

Първи стъпки с Asprise OCR SDK за Java

Първи стъпки с Asprise OCR SDK за Java Препоръчителният начин за инсталиране на Asprise OCR SDK за Java е използването на Maven. Моля, използвайте следната команда за гладка инсталация.

Зависимост на Maven за Asprise OCR SDK за Java


<dependencies>
	<dependency>
	<groupId>com.asprise.ocr</groupId>
	<artifactId>java-ocr-api;/artifactId>
	<version>[15,)</version>
    </dependency>
</dependencies>

Инсталирайте Asprise OCR SDK за Java чрез GitHub

 git clone https://github.com/Asprise/java-.net-ocr-api-library  

Извличане на текст в обикновен текстов формат чрез Java

Asprise OCR SDK за Java предоставя пълна функционалност за извличане на текст от изображения в обикновен текстов формат. Библиотеката позволява на потребителите лесно да извличат текстовото съдържание на сканирани документи или изображения и да го използват за по-нататъшна обработка или анализ. За да постигнете задачата за извличане на обикновен текст, първо трябва да заредите изображението от файл, входен поток или URL адрес и да приложите OCR разпознаване към зареденото изображение с помощта на API. Използвайте подходящата функция, за да извлечете разпознатия текст във формат на обикновен текст. Следното показва как да заредите изображение и разпознат текст като обикновен текст и резултатът се отпечатва на конзолата.

Зареждане на изображение и разпознат текст чрез Java API

import com.asprise.ocr.Ocr;

public class OCRTest {

    public static void main(String[] args) throws Exception {
        
        // Load image from file
        Ocr ocr = new Ocr();
        ocr.startEngine("eng", Ocr.SPEED_FASTEST);
        String recognizedText = ocr.recognize(new File("image.png"), Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

        // Print the plain text output
        System.out.println("Recognized Text: " + recognizedText);

        ocr.stopEngine();
    }
}

Извършване на различни OCR операции в Java приложения

Aprise OCR SDK за Java API позволява на разработчиците на софтуер да извършват различни OCR (оптично разпознаване на символи) операции върху различни типове документи. Библиотеката поддържа напълно различни видове OCR операции, като OCR файлове с изображения, OCR PDF файлове, OCR ръкописен текст, OCR множество езици, извършване на OCR на част от изображението, извършване на OCR на множество входни файлове в един кадър, извършване на OCR на определена страница от посочения TIFF файл, пакетна обработка на OCR и много други. Библиотеката предоставя мощен и гъвкав инструмент за извършване на OCR операции върху различни видове документи. С поддръжката му за множество езици, изображения и PDF файлове, ръкописен текст и групова обработка можете бързо и точно да извличате текст от вашите документи.

Извършване на OCR на множество файлове чрез Java библиотека

String s = ocr.recognize("test.png;test2.jpg", -1, 0, 0, 400, 200,
   Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

perform OCR on a PDF input file:
String s = ocr.recognize("test.pdf", -1, 100, 100, 400, 200,
   Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

Поддръжка на много нишки с помощта на Asprise OCR

Aprise OCR SDK за Java API включва пълна поддръжка за многопоточност, което позволява на разработчиците да обработват множество OCR задачи едновременно. Тази функция позволява на разработчиците да подобрят производителността на своите OCR приложения, като разпределят OCR обработката в множество нишки, които могат да работят едновременно на множество ядра или процесори. Поддръжката на многонишковостта е много адаптивна, позволявайки на разработчиците да настроят фино броя на нишките и OCR двигателите, за да отговарят на наличните ресурси и изискванията за обработка. Като цяло, поддръжката на многопоточност на Asprise OCR SDK за Java предоставя на разработчиците мощен и гъвкав инструмент за изграждане на високопроизводителни OCR приложения, които могат да обработват големи обеми текст бързо и ефективно.

Писане на хитър код за управление на нишки

OcrExecutorService oes =
  new OcrExecutorService("eng", Ocr.SPEED_FASTEST, 4); // 4 threads

List> futures = oes.invokeAll(Arrays.asList(
  new OcrExecutorService.OcrCallable(
    new File[] {new File("test1.png")},
      Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML),
  new OcrExecutorService.OcrCallable(
    new File[] {new File("test2.png")},
      Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML)
);

System.out.println("Result of test1.png: " + futures.get(0).get());
System.out.println("Result of test2.png: " + futures.get(1).get());

oes.shutdown(); // stops all OCR engines and disposes all threads
 Български