Aspose.OCR for Java
Топ Java OCR API за добавяне на операции за оптично разпознаване на знаци
Водещи Java API позволяват изграждането на приложение с възможности за оптично разпознаване на символи (OCR). Четете, разпознавайте текст от сканирани документи, изображения и други файлове чрез Java библиотека.
Aspose.OCR за Java е водеща машина за OCR (оптично разпознаване на знаци), която дава възможност на разработчиците на софтуер да интегрират функционалност за разпознаване на текст в своите Java приложения. Той е проектиран да бъде много лесен за работа и позволява на разработчиците на софтуер да разпознават текст от сканирани документи, изображения и други източници и може да се използва за извличане на текст от различни файлови формати, включително JPEG, PNG, BMP, TIFF, HTML, PDF и много други.
Aspose.OCR за Java използва усъвършенствани OCR алгоритми за точно разпознаване на текст от изображения, дори при сканирания с ниско качество или снимки. Той включва поддръжка за над 50 различни езика, включително английски, испански, френски, немски, китайски и др. Има няколко важни функции, които са част от библиотеката, като разпознаване на ръкописен текст, извличане на текст от екранни снимки, извличане на текст от конкретни области на изображение, създаване на PDF файлове с възможност за търсене, поддръжка за снимки на смартфон, поддръжка за премахване на шум, поддръжка за бинаризация на изображения, повишена достъпност и много Повече ▼.
Aspose.OCR за Java използва усъвършенствани алгоритми за OCR, които могат точно да разпознават текст от изображения, дори в нискокачествени сканирания или снимки. Библиотеката може да подобри достъпността за потребителите чрез лесно преобразуване на сканирани документи в цифрови документи с възможност за търсене. Със своите усъвършенствани OCR алгоритми, многоезична поддръжка и лесна интеграция, Aspose.OCR за Java бързо се превръща в OCR софтуер за разработчици, които искат да добавят OCR функционалност към своите Java приложения.
Първи стъпки с Aspose.OCR за Java
Препоръчителният начин за инсталиране на Aspose.OCR за Java е използването на Maven Repository. Моля, използвайте следната команда за гладка инсталация.
Инсталирайте Aspose.OCR за Java чрез Maven Repository
<repositories>
<repository>
<Id>AsposeJavaAPI</Id>
<name>Aspose Java API;/name>
<url>http://repository.aspose.com/repo/</url>
</repository>
</repositories>
Можете да изтеглите библиотеката директно от страницата на продукта Aspose.OCR
Извличане на текст от изображения чрез API на Python
Aspose.OCR за Java включва много полезни функции, позволяващи на разработчиците на софтуер да извличат текст от различни видове изображения в приложения на Python. Библиотеката включва поддръжка за четене на текст от растерни изображения като JPEG, PNG, WBMP, BMP, GIF и много други. Има и други полезни функции, част от библиотеката за работа с извличане на текст, като четене на текст от многостранични TIFF изображения, извличане на текст от пикселен масив, четене на изображения в режим на най-бързо разпознаване, разпознаване на един ред, извличане на текст от разписки и много други. Следващият пример показва как да извлечете текст от изображение с помощта на Java команди.
Как да извлечете текст от изображение чрез Java API?
AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();
Четене на конкретни области от изображение чрез Java API
Aspose.OCR за Java е полезна OCR библиотека, която позволява на разработчиците на софтуер да намират и четат само определени области от изображение, а не целия текст, като използват няколко реда Java код. Това е много полезна функция и може да бъде много полезна при групова обработка на унифицирани документи като визи, шофьорски книжки, лични карти и т.н. Той поддържа функции като извличане на текст вътре в правоъгълник на изображение, извличане на линии с координати, автоматично търсене на дума и полета за ограничаване на линии и много други. Следващият пример показва как да извлечете текст вътре в правоъгълник с помощта на Java код.
Как да извлечете текст вътре в правоъгълник чрез Java API?
AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));
Избор на специфични за документа области чрез Java API
Изображението на документ може да съдържа множество блокове с различно съдържание, като текстови абзаци, чертежи, диаграми, формули, таблици, карти и т.н. Aspose.OCR за Java позволява на разработчиците на софтуер да избират и откриват определени интересни области на страница с лекота и да извършват OCR операция върху нея. Библиотеката поддържа автоматично откриване на зони, както и можете да я замените, като изберете ръчно области на интерес. Следващият пример демонстрира как разработчиците на софтуер могат да активират автоматично откриване на области на документи в своите Java приложения.
Автоматично откриване на области на документи чрез Java API
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");