1. Prodotti
  2.   OCR
  3.   Java
  4.   Aspose.OCR for Java

Aspose.OCR for Java

 
 

Le migliori API Java OCR per aggiungere operazioni di riconoscimento ottico dei caratteri

Una delle principali API Java consente di creare applicazioni con funzionalità di riconoscimento ottico dei caratteri (OCR). Leggi, riconosci il testo da documenti scansionati, immagini e altri file tramite la libreria Java.

Aspose.OCR per Java è un motore OCR (riconoscimento ottico dei caratteri) leader che offre agli sviluppatori di software la capacità di integrare funzionalità di riconoscimento del testo nelle loro applicazioni Java. È progettato per essere molto semplice da gestire e consente agli sviluppatori di software di riconoscere il testo da documenti scansionati, immagini e altre fonti e può essere utilizzato per estrarre testo da vari formati di file, inclusi JPEG, PNG, BMP, TIFF, HTML, PDF e molti altri.

Aspose.OCR per Java utilizza algoritmi OCR avanzati per riconoscere accuratamente il testo dalle immagini, anche in scansioni o fotografie di bassa qualità. Include il supporto per oltre 50 lingue diverse, tra cui inglese, spagnolo, francese, tedesco, cinese e altro. Ci sono diverse funzionalità importanti che fanno parte della libreria come il riconoscimento del testo scritto a mano, l'estrazione del testo dagli screenshot, l'estrazione del testo da aree specifiche di un'immagine, la creazione di PDF ricercabili, il supporto per le foto dello smartphone, il supporto per la rimozione del rumore, il supporto per la binarizzazione delle immagini, una maggiore accessibilità e molte altre. Di più.

Aspose.OCR per Java utilizza algoritmi OCR avanzati in grado di riconoscere accuratamente il testo dalle immagini, anche in scansioni o fotografie di bassa qualità. La biblioteca può migliorare l'accessibilità per gli utenti convertendo facilmente i documenti scansionati in documenti digitali ricercabili. Con i suoi algoritmi OCR avanzati, il supporto di più lingue e la facile integrazione, Aspose.OCR per Java sta rapidamente diventando il software OCR di riferimento per gli sviluppatori che desiderano aggiungere funzionalità OCR alle loro applicazioni Java.

Previous Next

Introduzione a Aspose.OCR per Java

Il modo consigliato per installare Aspose.OCR per Java utilizza Maven Repository. Si prega di utilizzare il seguente comando per un'installazione fluida.

Installa Aspose.OCR per Java tramite il repository Maven

 <repositories>
	<repository>
	<Id>AsposeJavaAPI</Id>
	<name>Aspose Java API;/name>
	<url>http://repository.aspose.com/repo/</url>
    </repository>
</repositories>

Puoi scaricare la libreria direttamente dalla Aspose.OCR pagina del prodotto

Estrai testo dalle immagini tramite API Python

Aspose.OCR per Java ha incluso funzionalità molto utili che consentono agli sviluppatori di software di estrarre testo da vari tipi di immagini all'interno delle applicazioni Python. La libreria include il supporto per la lettura di testo da immagini raster come JPEG, PNG, WBMP, BMP, GIF e molte altre. Ci sono altre funzioni utili che fanno parte della libreria per gestire l'estrazione del testo come leggere testo da immagini TIFF multipagina, estrarre testo da array di pixel, leggere immagini nella modalità di riconoscimento più veloce, riconoscere una singola riga, estrarre testo da ricevute e molto altro. L'esempio seguente mostra come estrarre il testo da un'immagine utilizzando i comandi Java.

Come estrarre il testo dall'immagine utilizzando l'API Java?

AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
	System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();

Leggi aree specifiche di un'immagine tramite API Java

Aspose.OCR per Java è un'utile libreria OCR che consente agli sviluppatori di software di trovare e leggere solo aree particolari di un'immagine, non tutto il testo, utilizzando un paio di righe di codice Java. È una funzionalità molto utile e può essere molto utile nell'elaborazione batch di documenti uniformi come visti, patenti di guida, carte d'identità e così via. Supporta funzionalità come l'estrazione di testo all'interno di un rettangolo di immagine, l'estrazione di linee con coordinate, la ricerca automatica di riquadri di delimitazione di parole e linee e molto altro. L'esempio seguente mostra come estrarre il testo all'interno di un rettangolo utilizzando il codice Java.

Come estrarre il testo all'interno di un rettangolo tramite API Java?

AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);	
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));

Seleziona aree specifiche del documento tramite API Java

Un'immagine di un documento può contenere numerosi blocchi di vari contenuti come paragrafi di testo, disegni, diagrammi, formule, tabelle, mappe e così via. Aspose.OCR per Java consente agli sviluppatori di software di selezionare e rilevare con facilità particolari aree di interesse su una pagina ed eseguire operazioni OCR su di essa. La libreria supporta il rilevamento automatico dell'area ed è possibile sovrascriverlo selezionando manualmente le aree di interesse. L'esempio seguente ha dimostrato come gli sviluppatori di software possono abilitare il rilevamento automatico delle aree dei documenti all'interno delle loro applicazioni Java.

Rilevamento automatico delle aree del documento tramite API Java

 // Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");

 Italiano