1. Produkty
  2.   OCR
  3.   Java
  4.   Aspose.OCR for Java

Aspose.OCR for Java

 
 

Najlepszy interfejs API Java OCR umożliwiający dodanie operacji optycznego rozpoznawania znaków

Wiodące interfejsy API Java umożliwiają tworzenie aplikacji z funkcjami optycznego rozpoznawania znaków (OCR). Czytaj, rozpoznawaj tekst ze zeskanowanych dokumentów, obrazów i innych plików za pośrednictwem biblioteki Java.

Aspose.OCR dla Java to wiodący silnik OCR (optyczne rozpoznawanie znaków), który daje twórcom oprogramowania możliwość zintegrowania funkcji rozpoznawania tekstu z ich aplikacjami Java. Został zaprojektowany tak, aby był bardzo prosty w obsłudze i umożliwia twórcom oprogramowania rozpoznawanie tekstu ze zeskanowanych dokumentów, obrazów i innych źródeł, a także może być używany do wyodrębniania tekstu z różnych formatów plików, w tym JPEG, PNG, BMP, TIFF, HTML, PDF i wiele innych.

Aspose.OCR dla Java wykorzystuje zaawansowane algorytmy OCR do dokładnego rozpoznawania tekstu z obrazów, nawet w przypadku skanów lub fotografii o niskiej jakości. Obejmuje obsługę ponad 50 różnych języków, w tym angielskiego, hiszpańskiego, francuskiego, niemieckiego, chińskiego i innych. Biblioteka zawiera kilka ważnych funkcji, takich jak rozpoznawanie tekstu odręcznego, wyodrębnianie tekstu ze zrzutów ekranu, wyodrębnianie tekstu z określonych obszarów obrazu, tworzenie przeszukiwalnych plików PDF, obsługa zdjęć ze smartfonów, obsługa usuwania szumów, obsługa binaryzacji obrazów, zwiększona dostępność i wiele więcej.

Aspose.OCR dla Java wykorzystuje zaawansowane algorytmy OCR, które potrafią dokładnie rozpoznać tekst z obrazów, nawet w przypadku skanów lub fotografii o niskiej jakości. Biblioteka może zwiększyć dostępność dla użytkowników, z łatwością konwertując zeskanowane dokumenty na dokumenty cyfrowe z możliwością przeszukiwania. Dzięki zaawansowanym algorytmom OCR, obsłudze wielu języków i łatwej integracji, Aspose.OCR dla Java szybko staje się najczęściej wybieranym oprogramowaniem OCR dla programistów chcących dodać funkcjonalność OCR do swoich aplikacji Java.

Previous Next

Pierwsze kroki z Aspose.OCR dla Java

Zalecany sposób instalacji Aspose.OCR dla Java polega na użyciu repozytorium Maven. Aby instalacja przebiegła bezproblemowo, użyj poniższego polecenia.

Zainstaluj Aspose.OCR dla Java poprzez repozytorium Maven

 <repositories>
	<repository>
	<Id>AsposeJavaAPI</Id>
	<name>Aspose Java API;/name>
	<url>http://repository.aspose.com/repo/</url>
    </repository>
</repositories>

Możesz pobrać bibliotekę bezpośrednio ze strony produktu Aspose.OCR

Wyodrębnij tekst z obrazów za pomocą interfejsu API języka Python

Aspose.OCR dla Java zawiera bardzo przydatne funkcje umożliwiające twórcom oprogramowania wyodrębnianie tekstu z różnych typów obrazów w aplikacjach Pythona. Biblioteka obsługuje czytanie tekstu z obrazów rastrowych, takich jak JPEG, PNG, WBMP, BMP, GIF i wiele innych. Biblioteka zawiera inne przydatne funkcje do obsługi ekstrakcji tekstu, takie jak czytanie tekstu z wielostronicowych obrazów TIFF, wyodrębnianie tekstu z tablicy pikseli, czytanie obrazów w najszybszym trybie rozpoznawania, rozpoznawanie pojedynczej linii, wyodrębnianie tekstu z paragonów i wiele innych. Poniższy przykład pokazuje, jak wyodrębnić tekst z obrazu za pomocą poleceń Java.

Jak wyodrębnić tekst z obrazu przy użyciu interfejsu Java API?

AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
	System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();

Odczytaj określone obszary obrazu za pomocą interfejsu Java API

Aspose.OCR dla języka Java to przydatna biblioteka OCR umożliwiająca twórcom oprogramowania znajdowanie i odczytywanie tylko określonych obszarów obrazu, a nie całego tekstu, przy użyciu kilku linii kodu Java. Jest to bardzo przydatna funkcja, która może być bardzo pomocna w przetwarzaniu zbiorczym jednolitych dokumentów, takich jak wizy, prawa jazdy, dowody osobiste i tak dalej. Obsługuje takie funkcje, jak wyodrębnianie tekstu z prostokąta obrazu, wyodrębnianie linii ze współrzędnymi, automatyczne wyszukiwanie słów i obwiedni linii oraz wiele innych. Poniższy przykład pokazuje, jak wyodrębnić tekst wewnątrz prostokąta przy użyciu kodu Java.

Jak wyodrębnić tekst z prostokąta za pomocą interfejsu API Java?

AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);	
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));

Wybierz określone obszary dokumentu za pomocą interfejsu Java API

Obraz dokumentu może zawierać wiele bloków o różnej treści, takich jak akapity tekstowe, rysunki, diagramy, formuły, tabele, mapy i tak dalej. Aspose.OCR dla Java umożliwia twórcom oprogramowania z łatwością wybierać i wykrywać określone obszary zainteresowań na stronie oraz wykonywać na nich operacje OCR. Biblioteka obsługuje automatyczne wykrywanie obszarów, ale można to pominąć, ręcznie wybierając obszary zainteresowania. Poniższy przykład pokazuje, jak twórcy oprogramowania mogą włączyć automatyczne wykrywanie obszarów dokumentów w swoich aplikacjach Java.

Automatyczne wykrywanie obszarów dokumentów za pośrednictwem interfejsu API języka Java

 // Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");

 Polski