1. produkty
  2.   OCR
  3.   Java
  4.   Aspose.OCR for Java

Aspose.OCR for Java

 
 

Nejlepší Java OCR API pro přidání operací optického rozpoznávání znaků

Přední Java API umožňuje vytvářet aplikace s funkcemi optického rozpoznávání znaků (OCR). Číst a rozpoznávat text z naskenovaných dokumentů, obrázků a dalších souborů prostřednictvím knihovny Java.

Aspose.OCR for Java je přední motor OCR (Optical Character Recognition), který vývojářům softwaru umožňuje integrovat funkce rozpoznávání textu do jejich aplikací Java. Je navržen tak, aby se s ním velmi snadno manipulovalo a umožňuje vývojářům softwaru rozpoznat text z naskenovaných dokumentů, obrázků a dalších zdrojů a lze jej použít k extrahování textu z různých formátů souborů, včetně JPEG, PNG, BMP, TIFF, HTML, PDF. a mnoho dalších.

Aspose.OCR for Java používá pokročilé algoritmy OCR k přesnému rozpoznání textu z obrázků, a to i v nekvalitních skenech nebo fotografiích. Obsahuje podporu pro více než 50 různých jazyků, včetně angličtiny, španělštiny, francouzštiny, němčiny, čínštiny a dalších. Součástí knihovny je několik důležitých funkcí, jako je rozpoznávání ručně psaného textu, extrahování textu ze snímků obrazovky, extrahování textu z konkrétních oblastí obrázku, vytváření prohledávatelných souborů PDF, podpora fotografií ze smartphonu, podpora odstraňování šumu, podpora binarizace obrázků, zvýšená dostupnost a mnoho dalších více.

Aspose.OCR for Java používá pokročilé algoritmy OCR, které dokážou přesně rozpoznat text od obrázků, a to i v nekvalitních skenech nebo fotografiích. Knihovna může zlepšit dostupnost pro uživatele tím, že snadno převede naskenované dokumenty na digitální dokumenty s možností vyhledávání. Díky pokročilým algoritmům OCR, podpoře více jazyků a snadné integraci se Aspose.OCR for Java rychle stává oblíbeným softwarem OCR pro vývojáře, kteří chtějí přidat funkci OCR do svých aplikací Java.

Previous Next

Začínáme s Aspose.OCR pro Java

Doporučený způsob instalace Aspose.OCR for Java je použití Maven Repository. Pro bezproblémovou instalaci použijte prosím následující příkaz.

Nainstalujte Aspose.OCR pro Javu přes Maven Repository

 <repositories>
	<repository>
	<Id>AsposeJavaAPI</Id>
	<name>Aspose Java API;/name>
	<url>http://repository.aspose.com/repo/</url>
    </repository>
</repositories>

Knihovnu si můžete stáhnout přímo z produktové stránky Aspose.OCR

Extrahujte text z obrázků přes Python API

Aspose.OCR for Java obsahuje velmi užitečné funkce umožňující vývojářům softwaru extrahovat text z různých typů obrázků v aplikacích Python. Knihovna obsahuje podporu pro čtení textu z rastrových obrázků, jako jsou JPEG, PNG, WBMP, BMP, GIF a mnoho dalších. Součástí knihovny jsou další užitečné funkce pro manipulaci s extrakcí textu, jako je čtení textu z vícestránkových obrázků TIFF, extrahování textu z pixelového pole, čtení obrázků v režimu nejrychlejšího rozpoznávání, rozpoznávání jednoho řádku, extrahování textu z účtenek a mnoho dalších. Následující příklad ukazuje, jak extrahovat text z obrázku pomocí příkazů Java.

Jak extrahovat text z obrázku pomocí Java API?

AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
	System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();

Čtení konkrétních oblastí obrázku prostřednictvím Java API

Aspose.OCR for Java je užitečná knihovna OCR, která umožňuje vývojářům softwaru najít a přečíst pouze určité oblasti obrázku, nikoli celý text pomocí několika řádků kódu Java. Je to velmi užitečná funkce a může být velmi užitečná při dávkovém zpracování jednotných dokumentů, jako jsou víza, řidičské průkazy, ID karty a tak dále. Podporuje funkce jako extrahování textu uvnitř obrazového obdélníku, extrahování řádků se souřadnicemi, automatické vyhledávání slov a ohraničovacích políček řádků a mnoho dalších. Následující příklad ukazuje, jak extrahovat text uvnitř obdélníku pomocí kódu Java.

Jak extrahovat text uvnitř obdélníku přes Java API?

AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);	
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));

Vyberte specifické oblasti dokumentu prostřednictvím rozhraní Java API

Obrázek dokumentu může obsahovat mnoho bloků různého obsahu, jako jsou textové odstavce, nákresy, diagramy, vzorce, tabulky, mapy a podobně. Aspose.OCR for Java umožňuje vývojářům softwaru snadno vybrat a detekovat konkrétní oblasti zájmu na stránce a provádět na ní operace OCR. Knihovna podporuje automatickou detekci oblastí a můžete ji přepsat ručním výběrem oblastí zájmu. Následující příklad ukazuje, jak mohou vývojáři softwaru povolit automatickou detekci oblastí dokumentů uvnitř svých aplikací Java.

Automatická detekce oblastí dokumentu prostřednictvím Java API

 // Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");

 Čeština