Aspose.OCR for Java

Топ Java OCR API для додавання операцій оптичного розпізнавання символів

Провідні API Java дозволяють створювати програми з можливостями оптичного розпізнавання символів (OCR). Читайте, розпізнавайте текст зі сканованих документів, зображень та інших файлів за допомогою бібліотеки Java.

Aspose.OCR для Java — це провідний механізм OCR (оптичне розпізнавання символів), який дає розробникам програмного забезпечення можливість інтегрувати функцію розпізнавання тексту у свої програми Java. Він дуже простий у користуванні та дозволяє розробникам програмного забезпечення розпізнавати текст зі сканованих документів, зображень та інших джерел, а також може використовуватися для отримання тексту з різних форматів файлів, включаючи JPEG, PNG, BMP, TIFF, HTML, PDF та багато інших.

Aspose.OCR для Java використовує розширені алгоритми розпізнавання тексту для точного розпізнавання тексту на зображеннях, навіть на низькоякісних сканах або фотографіях. Він включає підтримку понад 50 різних мов, включаючи англійську, іспанську, французьку, німецьку, китайську тощо. У бібліотеці є кілька важливих функцій, таких як розпізнавання рукописного тексту, вилучення тексту зі знімків екрана, вилучення тексту з певних областей зображення, створення PDF-файлів із можливістю пошуку, підтримка фотографій зі смартфона, підтримка видалення шуму, підтримка бінаризації зображень, покращена доступність та багато інших. більше.

Aspose.OCR для Java використовує розширені алгоритми OCR, які можуть точно розпізнавати текст із зображень, навіть на сканованих або фотографіях низької якості. Бібліотека може покращити доступність для користувачів шляхом легкого перетворення сканованих документів у цифрові документи з можливістю пошуку. Завдяки вдосконаленим алгоритмам оптичного розпізнавання символів, підтримці кількох мов і легкій інтеграції Aspose.OCR для Java швидко стає популярним програмним забезпеченням для оптичного розпізнавання символів для розробників, які бажають додати функції оптичного розпізнавання символів у свої програми Java.

Огляд

Огляд функцій Aspose.OCR для Java.

Огляд функцій

Операції OCR
Додати можливості OCR
Розпізнати текст зображення
Перетворення зображень тексту
Текст розпізнаного шрифту
Пошук PDF
27 мов розпізнавання
Створюйте програми OCR
Зберегти у браузері
Витягти текст
Підтримка багатопоточності

Огляд функцій

Розпізнати повернуте зображення
Фільтри попередньої обробки
PDF у зображення
Розпізнає китайські символи
Виявляє популярні шрифти
Обробляє все зображення
Підтримка повернутих зображень
Пакетне розпізнавання
Вбудована перевірка правопису
Розділити PDF
PDF в Excel
З PDF у SVG

Aspose.OCR for Java

API переважно підтримує формат PDF, але може експортувати PDF-документи в низку інших форматів.

читач

PDF, PDF/A, TEX, XPS, SVG

Письменник

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR for Java

Незалежність від платформи

Aspose.OCR для Java може працювати з будь-якою мовою програмування на основі Java.

Java Runtime

Aspose.OCR for Java

Початок роботи з Aspose.OCR для Java

Рекомендований спосіб інсталяції Aspose.OCR для Java – використання сховища Maven. Будь ласка, використовуйте наступну команду для плавного встановлення.

Установіть Aspose.OCR для Java через репозиторій Maven

 <repositories>
	<repository>
	<Id>AsposeJavaAPI</Id>
	<name>Aspose Java API;/name>
	<url>http://repository.aspose.com/repo/</url>
    </repository>
</repositories>

Ви можете завантажити бібліотеку безпосередньо зі сторінки продукту Aspose.OCR

Вилучення тексту із зображень за допомогою API Python

Aspose.OCR для Java містить дуже корисні функції, які дозволяють розробникам програмного забезпечення отримувати текст із різних типів зображень у програмах Python. Бібліотека включає підтримку для читання тексту з растрових зображень, таких як JPEG, PNG, WBMP, BMP, GIF та багатьох інших. У бібліотеці є й інші корисні функції для обробки вилучення тексту, як-от читання тексту з багатосторінкових зображень TIFF, вилучення тексту з масиву пікселів, читання зображень у режимі найшвидшого розпізнавання, розпізнавання одного рядка, вилучення тексту з квитанцій та багато іншого. У наступному прикладі показано, як отримати текст із зображення за допомогою команд Java.

Як витягти текст із зображення за допомогою Java API?

AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
	System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();

Читання певних областей зображення за допомогою Java API

Aspose.OCR для Java — це корисна бібліотека оптичного розпізнавання символів, яка дозволяє розробникам програмного забезпечення знаходити та читати лише окремі області зображення, а не весь текст, використовуючи кілька рядків коду Java. Це дуже корисна функція, яка може бути дуже корисною при пакетній обробці уніфікованих документів, таких як візи, водійські права, ідентифікаційні картки тощо. Він підтримує такі функції, як виділення тексту всередині прямокутника зображення, виділення ліній із координатами, автоматичний пошук слів і рамок обмеження ліній та багато інших. У наступному прикладі показано, як витягнути текст усередині прямокутника за допомогою коду Java.

Як витягти текст усередині прямокутника за допомогою Java API?

AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);	
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));

Вибір окремих областей документа за допомогою Java API

Зображення документа може містити численні блоки різного вмісту, як-от абзаци тексту, малюнки, діаграми, формули, таблиці, карти тощо. Aspose.OCR для Java дозволяє розробникам програмного забезпечення з легкістю вибирати та виявляти окремі цікаві області на сторінці та виконувати на ній операцію OCR. Бібліотека підтримує автоматичне визначення області, а також ви можете змінити це, вибравши вручну області інтересу. У наступному прикладі показано, як розробники програмного забезпечення можуть увімкнути автоматичне виявлення областей документа в своїх програмах Java.

Автоматичне визначення областей документа через Java API

 // Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");