1. Des produits
  2.   OCR
  3.   Java
  4.   Aspose.OCR for Java

Aspose.OCR for Java

 
 

Meilleure API Java OCR pour ajouter des opérations de reconnaissance optique de caractères

Une API Java de pointe permet de créer une application avec des capacités de reconnaissance optique de caractères (OCR). Lisez et reconnaissez le texte des documents numérisés, des images et d'autres fichiers via la bibliothèque Java.

Aspose.OCR for Java est un moteur OCR (Optical Character Recognition) de premier plan qui donne aux développeurs de logiciels la possibilité d'intégrer une fonctionnalité de reconnaissance de texte dans leurs applications Java. Il est conçu pour être très simple à gérer et permet aux développeurs de logiciels de reconnaître le texte des documents numérisés, des images et d'autres sources, et peut être utilisé pour extraire du texte de divers formats de fichiers, notamment JPEG, PNG, BMP, TIFF, HTML, PDF. et bien d'autres.

Aspose.OCR pour Java utilise des algorithmes OCR avancés pour reconnaître avec précision le texte des images, même dans les numérisations ou les photographies de mauvaise qualité. Il prend en charge plus de 50 langues différentes, dont l'anglais, l'espagnol, le français, l'allemand, le chinois et plus encore. La bibliothèque comporte plusieurs fonctionnalités importantes telles que la reconnaissance de texte manuscrit, l'extraction de texte à partir de captures d'écran, l'extraction de texte de zones spécifiques d'une image, la création de fichiers PDF consultables, la prise en charge des photos sur smartphone, la prise en charge de la suppression du bruit, la prise en charge de la binarisation d'image, l'accessibilité accrue et bien d'autres. plus.

Aspose.OCR pour Java utilise des algorithmes OCR avancés capables de reconnaître avec précision le texte des images, même dans les numérisations ou les photographies de mauvaise qualité. La bibliothèque peut améliorer l'accessibilité pour les utilisateurs en convertissant facilement les documents numérisés en documents numériques consultables. Avec ses algorithmes OCR avancés, sa prise en charge de plusieurs langues et son intégration facile, Aspose.OCR pour Java devient rapidement le logiciel OCR incontournable pour les développeurs cherchant à ajouter des fonctionnalités OCR à leurs applications Java.

Previous Next

Premiers pas avec Aspose.OCR pour Java

La méthode recommandée pour installer Aspose.OCR pour Java consiste à utiliser le référentiel Maven. Veuillez utiliser la commande suivante pour une installation fluide.

Installer Aspose.OCR pour Java via le référentiel Maven

 <repositories>
	<repository>
	<Id>AsposeJavaAPI</Id>
	<name>Aspose Java API;/name>
	<url>http://repository.aspose.com/repo/</url>
    </repository>
</repositories>

Vous pouvez télécharger la bibliothèque directement depuis la Aspose.OCR page produit

Extraire le texte des images via l'API Python

Aspose.OCR pour Java inclut des fonctionnalités très utiles permettant aux développeurs de logiciels d'extraire du texte à partir de différents types d'images dans des applications Python. La bibliothèque inclut la prise en charge de la lecture de texte à partir d'images raster telles que JPEG, PNG, WBMP, BMP, GIF et bien d'autres. Il existe d'autres fonctionnalités utiles dans la bibliothèque pour gérer l'extraction de texte, telles que la lecture de texte à partir d'images TIFF multipages, l'extraction de texte à partir d'un tableau de pixels, la lecture d'images en mode de reconnaissance le plus rapide, la reconnaissance d'une seule ligne, l'extraction de texte à partir de reçus et bien d'autres. L'exemple suivant montre comment extraire le texte d'une image à l'aide de commandes Java.

Comment extraire le texte d'une image à l'aide de l'API Java ?

AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
	System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();

Lire des zones spécifiques d'une image via l'API Java

Aspose.OCR pour Java est une bibliothèque OCR utile permettant aux développeurs de logiciels de rechercher et de lire uniquement des zones particulières d'une image, et non l'intégralité du texte, à l'aide de quelques lignes de code Java. Il s'agit d'une fonctionnalité très utile et peut être très utile dans le traitement par lots de documents uniformes tels que les visas, les permis de conduire, les cartes d'identité, etc. Il prend en charge des fonctionnalités telles que l'extraction de texte à l'intérieur d'un rectangle d'image, l'extraction de lignes avec des coordonnées, la recherche automatique de cadres de délimitation de mots et de lignes, et bien d'autres. L'exemple suivant montre comment extraire du texte à l'intérieur d'un rectangle à l'aide du code Java.

Comment extraire du texte à l'intérieur d'un rectangle via l'API Java ?

AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);	
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));

Sélectionner des zones spécifiques au document via l'API Java

Une image de document peut contenir de nombreux blocs de contenu varié tels que des paragraphes de texte, des dessins, des diagrammes, des formules, des tableaux, des cartes, etc. Aspose.OCR pour Java permet aux développeurs de logiciels de sélectionner et de détecter facilement des zones d'intérêt particulières sur une page et d'y effectuer des opérations OCR. La bibliothèque prend en charge la détection automatique des zones et vous pouvez la remplacer en sélectionnant manuellement les zones d'intérêt. L'exemple suivant montre comment les développeurs de logiciels peuvent activer la détection automatique des zones de documents dans leurs applications Java.

Détection automatique des zones de documents via l'API Java

 // Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");

 Français