Fejlett ingyenes Ruby Library szövegek betöltéséhez és képekből való kivonásához
Vezető nyílt forráskódú Ruby OCR API és kép szöveggé konvertáló, amely lehetővé teszi a szoftverfejlesztők számára, hogy betöltsenek, felismerjenek és kivonjanak szöveget képekből (beolvasott képek és PDF fájlok)
Az optikai karakterfelismerés (OCR) egy hatékony technológia, amely lehetővé teszi a számítógépek számára, hogy felismerjék és kivonják a szöveget a képekből vagy a beolvasott dokumentumokból. Számos alkalmazása van, a nyomtatott anyagok digitalizálásától az adatbeviteli folyamatok automatizálásáig. A Ruby programozási nyelvben az OCR egyik népszerű könyvtára a Ruby-Tesseract-OCR. A Ruby-Tesseract-OCR egy Ruby drágakő, amely a Tesseract OCR motor burkolóanyagaként szolgál. A Tesseract a Google által kifejlesztett nyílt forráskódú OCR-motor, amely pontosságáról és nyelvi támogatásáról híres.
A Ruby-Tesseract-OCR túlmutat az alapvető OCR-képességeken, és további funkciókat kínál a haladó felhasználási esetekhez. Például a szoftverfejlesztők megadhatnak egy érdeklődési területet (ROI) a képen belül, hogy az OCR elemzést egy adott területre korlátozzák. Ez különösen akkor hasznos, ha összetett dokumentumokkal foglalkozik, vagy ha csak szöveget kell kivonnia egy adott szakaszból. A könyvtár számos további funkciót kínál az OCR képességek javításához, mint például egy meglévő kép betöltése, szöveg kinyerése képekből vagy beolvasott dokumentumokból, HOCR (HTML OCR) kimenet lekérése és még sok más.
A Ruby-Tesseract-OCR gyöngyszem egy könnyen használható interfészt biztosít a Tesseract motorral való interakcióhoz, lehetővé téve a Ruby fejlesztői számára, hogy könnyedén integrálják az OCR képességeket projektjeikbe. Legyen szó számlákról információ kinyerésére, nyomtatott anyagok digitalizálására vagy adatbeviteli feladatok automatizálására, a nyílt forráskódú könyvtár megbízható és hatékony megoldást nyújt. Próbálja ki, és aknázza ki az OCR-ben rejlő lehetőségeket Ruby-projektjeiben még ma.
Kezdő lépések a Ruby-Tesseract-OCR használatával
A Ruby-Tesseract-OCR telepítésének javasolt módja a Rubygems használata. Kérjük, használja a következő parancsot a zökkenőmentes telepítés érdekében.
Telepítse a Ruby-Tesseract-OCR-t a Rubygems segítségével
gem install tesseract-ocr
Az összeállított megosztott könyvtárat letöltheti a Github tárhelyről.
Szöveg kinyerése képekből és szkennelt dokumentumokból Ruby segítségével
A Ruby-Tesseract-OCR egy nagyon hatékony, nyílt forráskódú könyvtár, amely lehetővé teszi a szoftverfejlesztők számára, hogy szöveget töltsenek be és vonjanak ki különféle típusú képekből mindössze néhány sor Ruby kóddal. A könyvtár megkönnyíti a szövegek kinyerését képekből, PDF-fájlokból vagy szkennelt dokumentumokból. A tipikus munkafolyamat magában foglalja a kép betöltését, az OCR-paraméterek konfigurálását, és az OCR-motor meghívását a szöveg felismerésére. A sikeres működéshez a fejlesztőknek meg kell adniuk a feldolgozni kívánt kép elérési útját, és meg kell hívniuk a text_for metódust a szöveg kinyeréséhez. Végül az eredmény kinyomtatásra kerül a konzolra. A könyvtár különféle F-konfigurációs lehetőségeket kínál az OCR viselkedésének vezérléséhez, mint például az oldalszegmentálási mód, az engedélyezési lista karakterei stb. A következő példák bemutatják, hogyan tölthetnek be a szoftverfejlesztők egy JPEG-képet, és hogyan bonthatnak ki belőle szöveget a Ruby alkalmazásokon belül.
Hogyan lehet szöveget kivonni a képekből Ruby Commands használatával?
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
e.text_for('test/first.png').strip # => 'ABC'
Szöveg kinyerése egy adott képterületről Ruby segítségével
A nyílt forráskódú Ruby-Tesseract-OCR könyvtár túlmutat az alapvető OCR-képességeken, és további szolgáltatásokat kínál a haladó felhasználási esetekhez. Például a felhasználók megadhatnak egy érdekes régiót (ROI) a képen belül, hogy az OCR elemzést egy adott területre korlátozzák. Ez különösen hasznos összetett dokumentumok kezelésekor, vagy amikor a felhasználóknak csak egy adott szakaszból kell szöveget kivonniuk. Ezenkívül a könyvtár módszereket biztosít a HOCR (HTML OCR) kimenet megszerzésére, amely nemcsak a felismert szöveget tartalmazza, hanem a szövegelemek elrendezésére és koordinátáira vonatkozó információkat is. A HOCR kimenet akkor hasznos, ha részletesebb adatokra van szüksége, vagy további elemzést szeretne végezni a szövegszerkezeten.
Hogyan lehet hOCR-t végrehajtani egy képen a Ruby Library segítségével?
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
puts e.hocr_for('test/first.png')