Aspose.OCR for Java
Лучший Java OCR API для добавления операций оптического распознавания символовs
Ведущие API-интерфейсы Java позволяют создавать приложения с возможностями оптического распознавания символов (OCR). Читайте, распознавайте текст из отсканированных документов, изображений и других файлов с помощью библиотеки Java.
Aspose.OCR для Java — это ведущий механизм OCR (оптического распознавания символов), который дает разработчикам программного обеспечения возможность интегрировать функции распознавания текста в свои приложения Java. Он очень прост в использовании и позволяет разработчикам программного обеспечения распознавать текст из отсканированных документов, изображений и других источников, а также может использоваться для извлечения текста из файлов различных форматов, включая JPEG, PNG, BMP, TIFF, HTML, PDF. и многие другие.
Aspose.OCR для Java использует усовершенствованные алгоритмы оптического распознавания символов для точного распознавания текста на изображениях, даже на сканах или фотографиях низкого качества. Он включает поддержку более чем 50 различных языков, включая английский, испанский, французский, немецкий, китайский и другие. В библиотеке есть несколько важных функций, таких как распознавание рукописного текста, извлечение текста из снимков экрана, извлечение текста из определенных областей изображения, создание PDF-файлов с возможностью поиска, поддержка фотографий со смартфона, поддержка удаления шума, поддержка бинаризации изображений, повышенная доступность и многие другие. более.
Aspose.OCR для Java использует усовершенствованные алгоритмы оптического распознавания символов, которые могут точно распознавать текст на изображениях, даже на сканах или фотографиях низкого качества. Библиотека может повысить доступность для пользователей, легко преобразовывая отсканированные документы в цифровые документы с возможностью поиска. Благодаря передовым алгоритмам оптического распознавания текста, поддержке нескольких языков и простой интеграции Aspose.OCR для Java быстро становится популярным программным обеспечением оптического распознавания символов для разработчиков, желающих добавить функцию оптического распознавания текста в свои приложения Java.
Начало работы с Aspose.OCR для Java
Рекомендуемый способ установки Aspose.OCR для Java — использование репозитория Maven. Пожалуйста, используйте следующую команду для плавной установки.
Установите Aspose.OCR для Java через репозиторий Maven
<repositories>
<repository>
<Id>AsposeJavaAPI</Id>
<name>Aspose Java API;/name>
<url>http://repository.aspose.com/repo/</url>
</repository>
</repositories>
Вы можете загрузить библиотеку непосредственно со страницы продукта Aspose.OCR
Извлечение текста из изображений с помощью Python API
Aspose.OCR для Java включает в себя очень полезные функции, позволяющие разработчикам программного обеспечения извлекать текст из изображений различных типов внутри приложений Python. В библиотеку включена поддержка чтения текста из растровых изображений, таких как JPEG, PNG, WBMP, BMP, GIF и многих других. В библиотеке есть и другие полезные функции для обработки извлечения текста, такие как чтение текста из многостраничных изображений TIFF, извлечение текста из массива пикселей, чтение изображений в режиме быстрого распознавания, распознавание одной строки, извлечение текста из квитанций и многое другое. В следующем примере показано, как извлечь текст из изображения с помощью команд Java.
Как извлечь текст из изображения с помощью Java API?
AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();
Чтение определенных областей изображения через Java API
Aspose.OCR для Java — это полезная библиотека оптического распознавания символов, позволяющая разработчикам программного обеспечения находить и читать только определенные области изображения, а не весь текст, используя пару строк кода Java. Это очень полезная функция, которая может оказаться очень полезной при пакетной обработке одинаковых документов, таких как визы, водительские права, удостоверения личности и т. д. Он поддерживает такие функции, как извлечение текста внутри прямоугольника изображения, извлечение линий с координатами, автоматический поиск слов и ограничивающих рамок линий и многое другое. В следующем примере показано, как извлечь текст внутри прямоугольника с помощью кода Java.
Как извлечь текст внутри прямоугольника с помощью Java API?
AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));
Выбор конкретных областей документа через Java API
Изображение документа может содержать множество блоков различного содержания, таких как текстовые абзацы, рисунки, диаграммы, формулы, таблицы, карты и т. д. Aspose.OCR для Java позволяет разработчикам программного обеспечения с легкостью выбирать и обнаруживать определенные интересующие области на странице и выполнять над ней операции оптического распознавания символов. Библиотека поддерживает автоматическое определение областей, но вы можете отменить его, выбрав интересующие области вручную. В следующем примере показано, как разработчики программного обеспечения могут включить автоматическое обнаружение областей документа внутри своих приложений Java.
Автоматическое определение областей документа через Java API
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");