Aspose.OCR for Java

Топ Java OCR API за добавяне на операции за оптично разпознаване на знаци

Водещи Java API позволяват изграждането на приложение с възможности за оптично разпознаване на символи (OCR). Четете, разпознавайте текст от сканирани документи, изображения и други файлове чрез Java библиотека.

Aspose.OCR за Java е водеща машина за OCR (оптично разпознаване на знаци), която дава възможност на разработчиците на софтуер да интегрират функционалност за разпознаване на текст в своите Java приложения. Той е проектиран да бъде много лесен за работа и позволява на разработчиците на софтуер да разпознават текст от сканирани документи, изображения и други източници и може да се използва за извличане на текст от различни файлови формати, включително JPEG, PNG, BMP, TIFF, HTML, PDF и много други.

Aspose.OCR за Java използва усъвършенствани OCR алгоритми за точно разпознаване на текст от изображения, дори при сканирания с ниско качество или снимки. Той включва поддръжка за над 50 различни езика, включително английски, испански, френски, немски, китайски и др. Има няколко важни функции, които са част от библиотеката, като разпознаване на ръкописен текст, извличане на текст от екранни снимки, извличане на текст от конкретни области на изображение, създаване на PDF файлове с възможност за търсене, поддръжка за снимки на смартфон, поддръжка за премахване на шум, поддръжка за бинаризация на изображения, повишена достъпност и много Повече ▼.

Aspose.OCR за Java използва усъвършенствани алгоритми за OCR, които могат точно да разпознават текст от изображения, дори в нискокачествени сканирания или снимки. Библиотеката може да подобри достъпността за потребителите чрез лесно преобразуване на сканирани документи в цифрови документи с възможност за търсене. Със своите усъвършенствани OCR алгоритми, многоезична поддръжка и лесна интеграция, Aspose.OCR за Java бързо се превръща в OCR софтуер за разработчици, които искат да добавят OCR функционалност към своите Java приложения.

С един поглед

Общ преглед на функциите на Aspose.OCR за Java.

Преглед на характеристиките

OCR операции
Добавяне на възможности за OCR
Разпознаване на текст на изображение
Преобразувайте изображения на текст
Текст на разпознат шрифт
Търсене в PDF
27 езика за разпознаване
Създаване на OCR приложения
Запазване в браузър
Извличане на текст
Поддръжка на много нишки

Преглед на характеристиките

Разпознаване на завъртяно изображение
Филтри за предварителна обработка
PDF към изображения
Разпознава китайски символи
Открива популярни шрифтове
Обработва цялото изображение
Поддръжка на завъртяни изображения
Пакетно разпознаване
Вградена проверка на правописа
Разделяне на PDF
PDF към Excel
PDF към SVG

Aspose.OCR for Java

API поддържа главно PDF формат, но може да експортира PDF документи в редица други формати.

Читател

PDF, PDF/A, TEX, XPS, SVG

Писател

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR for Java

Независимост на платформата

Aspose.OCR за Java може да работи с всеки базиран на Java език за програмиране.

Java Runtime

Aspose.OCR for Java

Първи стъпки с Aspose.OCR за Java

Препоръчителният начин за инсталиране на Aspose.OCR за Java е използването на Maven Repository. Моля, използвайте следната команда за гладка инсталация.

Инсталирайте Aspose.OCR за Java чрез Maven Repository

 <repositories>
	<repository>
	<Id>AsposeJavaAPI</Id>
	<name>Aspose Java API;/name>
	<url>http://repository.aspose.com/repo/</url>
    </repository>
</repositories>

Можете да изтеглите библиотеката директно от страницата на продукта Aspose.OCR

Извличане на текст от изображения чрез API на Python

Aspose.OCR за Java включва много полезни функции, позволяващи на разработчиците на софтуер да извличат текст от различни видове изображения в приложения на Python. Библиотеката включва поддръжка за четене на текст от растерни изображения като JPEG, PNG, WBMP, BMP, GIF и много други. Има и други полезни функции, част от библиотеката за работа с извличане на текст, като четене на текст от многостранични TIFF изображения, извличане на текст от пикселен масив, четене на изображения в режим на най-бързо разпознаване, разпознаване на един ред, извличане на текст от разписки и много други. Следващият пример показва как да извлечете текст от изображение с помощта на Java команди.

Как да извлечете текст от изображение чрез Java API?

AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
	System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();

Четене на конкретни области от изображение чрез Java API

Aspose.OCR за Java е полезна OCR библиотека, която позволява на разработчиците на софтуер да намират и четат само определени области от изображение, а не целия текст, като използват няколко реда Java код. Това е много полезна функция и може да бъде много полезна при групова обработка на унифицирани документи като визи, шофьорски книжки, лични карти и т.н. Той поддържа функции като извличане на текст вътре в правоъгълник на изображение, извличане на линии с координати, автоматично търсене на дума и полета за ограничаване на линии и много други. Следващият пример показва как да извлечете текст вътре в правоъгълник с помощта на Java код.

Как да извлечете текст вътре в правоъгълник чрез Java API?

AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);	
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));

Избор на специфични за документа области чрез Java API

Изображението на документ може да съдържа множество блокове с различно съдържание, като текстови абзаци, чертежи, диаграми, формули, таблици, карти и т.н. Aspose.OCR за Java позволява на разработчиците на софтуер да избират и откриват определени интересни области на страница с лекота и да извършват OCR операция върху нея. Библиотеката поддържа автоматично откриване на зони, както и можете да я замените, като изберете ръчно области на интерес. Следващият пример демонстрира как разработчиците на софтуер могат да активират автоматично откриване на области на документи в своите Java приложения.

Автоматично откриване на области на документи чрез Java API

 // Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");