Aspose.OCR for Java
A legnépszerűbb Java OCR API optikai karakterfelismerő műveletek hozzáadásához
A vezető Java API-k lehetővé teszik az optikai karakterfelismerő (OCR) képességekkel rendelkező alkalmazások létrehozását. Szöveg olvasása, felismerése beolvasott dokumentumokból, képekből és egyéb fájlokból a Java Library segítségével.
Az Aspose.OCR for Java egy vezető OCR (Optical Character Recognition) motor, amely lehetővé teszi a szoftverfejlesztők számára, hogy szövegfelismerő funkciót integráljanak Java-alkalmazásaikba. Úgy tervezték, hogy nagyon egyszerűen kezelhető legyen, és lehetővé teszi a szoftverfejlesztők számára, hogy felismerjék a beolvasott dokumentumokból, képekből és más forrásokból származó szöveget, valamint szövegek kinyerésére használhatók különböző fájlformátumokból, beleértve a JPEG, PNG, BMP, TIFF, HTML, PDF fájlokat. és még sokan mások.
Az Aspose.OCR for Java fejlett OCR-algoritmusokat használ a szöveg pontos felismerésére a képekből, még gyenge minőségű beolvasások vagy fényképek esetén is. Több mint 50 különböző nyelv támogatását tartalmazza, beleértve az angolt, spanyolt, franciát, németet, kínait és még sok mást. A könyvtárnak számos fontos funkciója van, mint például a kézzel írt szövegfelismerés, szöveg kibontása képernyőképekből, szöveg kibontása a kép bizonyos területeiről, kereshető PDF-ek létrehozása, okostelefonos fényképek támogatása, zajeltávolítás támogatása, képbinarizálás támogatása, megnövelt hozzáférhetőség és sok más. több.
Az Aspose.OCR for Java fejlett OCR-algoritmusokat használ, amelyek még gyenge minőségű beolvasások vagy fényképek esetén is pontosan felismerik a szöveget a képekből. A könyvtár javíthatja a felhasználók hozzáférését azáltal, hogy a beszkennelt dokumentumokat könnyedén kereshető digitális dokumentumokká alakítja át. Fejlett OCR-algoritmusaival, többnyelvű támogatásával és egyszerű integrációjával az Aspose.OCR for Java gyorsan a legnépszerűbb OCR-szoftverré válik azon fejlesztők számára, akik OCR-funkciókat szeretnének hozzáadni Java-alkalmazásaikhoz.
Az Aspose.OCR for Java kezdő lépései
Az Aspose.OCR for Java telepítésének javasolt módja a Maven Repository használata. Kérjük, használja a következő parancsot a zökkenőmentes telepítés érdekében.
Az Aspose.OCR for Java telepítése a Maven Repository-n keresztül
<repositories>
<repository>
<Id>AsposeJavaAPI</Id>
<name>Aspose Java API;/name>
<url>http://repository.aspose.com/repo/</url>
</repository>
</repositories>
A könyvtárat közvetlenül az Aspose.OCR termékoldaláról töltheti le
Szöveg kinyerése a képekből Python API-n keresztül
Az Aspose.OCR for Java nagyon hasznos szolgáltatásokat tartalmazott, amelyek lehetővé teszik a szoftverfejlesztők számára, hogy szöveget vonjanak ki a Python-alkalmazásokon belüli különböző típusú képekből. A könyvtár támogatja a szövegek olvasását raszteres képekről, például JPEG, PNG, WBMP, BMP, GIF és sok másról. A könyvtár további hasznos funkciókat is tartalmaz a szövegkivonás kezeléséhez, mint például szöveg olvasása többoldalas TIFF-képekből, szöveg kinyerése pixeltömbből, képek olvasása a leggyorsabb felismerési módban, egyetlen sor felismerése, szöveg kinyerése a nyugtákból és még sok más. A következő példa bemutatja, hogyan lehet szöveget kivonni egy képből Java parancsok segítségével.
Hogyan lehet szöveget kivonni a képből Java API segítségével?
AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();
Egy kép meghatározott területeinek olvasása Java API-n keresztül
Az Aspose.OCR for Java egy hasznos OCR-könyvtár, amely lehetővé teszi a szoftverfejlesztők számára, hogy a képnek csak bizonyos területeit találják meg és olvassák el, nem az összes szöveget néhány soros Java-kód használatával. Ez egy nagyon hasznos funkció, és nagyon hasznos lehet az egységes dokumentumok, például vízumok, jogosítványok, személyi igazolványok stb. kötegelt feldolgozásakor. Támogatja az olyan funkciókat, mint a szöveg kinyerése egy kép téglalapon belül, vonalak kivonatolása koordinátákkal, automatikus keresés a szó- és sorhatároló dobozokra és még sok más. A következő példa bemutatja, hogyan lehet Java kóddal szöveget kivonni egy téglalapból.
Hogyan lehet szöveget kivonni egy téglalapból Java API-n keresztül?
AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));
Dokumentumspecifikus területek kiválasztása Java API-n keresztül
Egy dokumentum képe számos különböző tartalmú blokkot tartalmazhat, például szöveges bekezdéseket, rajzokat, diagramokat, képleteket, táblázatokat, térképeket és így tovább. Az Aspose.OCR for Java lehetővé teszi a szoftverfejlesztők számára, hogy könnyedén kiválasszák és felismerjék az oldal bizonyos érdeklődési területeit, és OCR műveleteket hajtsanak végre rajta. A könyvtár támogatja az automatikus területérzékelést, valamint felülbírálhatja az érdeklődési körök manuális kiválasztásával. A következő példa bemutatja, hogyan engedélyezhetik a szoftverfejlesztők a dokumentumterületek automatikus felismerését Java-alkalmazásaikon belül.
Automatikus dokumentumterület-észlelés Java API-n keresztül
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");