Nyílt forráskódú Ruby Library a képek online szöveggé konvertálásához
Az ingyenes Ruby Optical Character Recognition (OCR) könyvtár lehetővé teszi a szoftverfejlesztők számára, hogy képeket, PDF-eket vagy szkennelt dokumentumokat szöveggé vagy kereshető dokumentumokká alakítsanak be, olvassanak be és alakítsanak át
Az optikai karakterfelismerő (OCR) technológia jelentős fejlődést ért el az elmúlt években, megkönnyítve a különböző forrásokból történő adatkinyerés automatizálását. Lehetővé teszi az automatizálást, javítja az adatok hozzáférhetőségét és növeli a termelékenységet a különböző területeken. Az egyik ilyen hatékony eszköz az OcrSpace Ruby könyvtár, amely egyszerű megoldást kínál a fejlesztőknek az OCR képességek Ruby alkalmazásaikba való integrálására. Ez a könyvtár leegyszerűsíti a szövegek kinyerésének folyamatát képekből, beolvasott dokumentumokból és PDF-fájlokból, így kiváló választás a kényelmes OCR-megoldást kereső fejlesztők számára.
Az OcrSpace Ruby könyvtár egyszerű és intuitív felületet kínál, amely megkönnyíti az OCR képességek Ruby alkalmazásokba való integrálását. A könyvtárnak számos fontos funkciója van, mint például különféle típusú képek betöltése, szövegek kinyerése a képekből, szkennelt dokumentumok szöveggé konvertálása, szöveg kinyerése több nyelven írt dokumentumokból, szöveg felismerése kis felbontású képekről, kézírásos tartalommal való munkavégzés. , a felismert szöveg koordinátáinak lekérése, oldalszámok észlelése, konkrét érdeklődési területek azonosítása és még sok más.
Az OcrSpace Ruby könyvtár az Ocr.Space OCR API köré épülő csomag, amely megbízható és pontos szövegkinyerést kínál képekből és PDF dokumentumokból. A kifejezetten a Ruby fejlesztők számára készült könyvtár leegyszerűsíti az integrációs folyamatot, lehetővé téve a programozóknak, hogy gyorsan beépítsék az OCR-funkciókat alkalmazásaikba anélkül, hogy az alapul szolgáló API bonyolultságával kellene foglalkozniuk. Akár dokumentumkezelő rendszert épít, akár automatizálja az adatkinyerést, akár javítja a hozzáférhetőséget, az OcrSpace Ruby könyvtár felbecsülhetetlen értékű eszköz, amely leegyszerűsíti az OCR-folyamatot, és pontos szövegkivonási képességekkel ruházza fel alkalmazásait.
Az OcrSpace első lépései
Az OcrSpace telepítésének javasolt módja a Rubygems használata. Kérjük, használja a következő parancsot a zökkenőmentes telepítés érdekében.
Telepítse az OcrSpace-t a Rubygems segítségével
$ gem install ocr_space
Az összeállított megosztott könyvtárat letöltheti a Github tárhelyről.
Képek konvertálása URL-ből szöveggé a Ruby API-n keresztül
A nyílt forráskódú OcrSpace könyvtár néhány hatékony funkciót tartalmaz a különféle típusú képek betöltéséhez és szöveggé alakításához néhány sor Ruby kóddal. A könyvtár számos OCR-beállítást támogat, beleértve a szövegek kibontását képekből, beolvasott dokumentumokból és PDF-fájlokból. Függetlenül attól, hogy a szoftverfejlesztőknek számlákat, nyugtákat vagy bármilyen más típusú dokumentumot kell feldolgozniuk, az OcrSpace Ruby könyvtár ezt hatékonyan tudja kezelni. A következő példa bemutatja, hogy a szoftverfejlesztők hogyan alakíthatják át a képeket szöveggé URL-en keresztül a Ruby API használatával.
Képek konvertálása URL-ből a Ruby API-n keresztül
result = resource.convert url: "http://bit.ly/2ih9aXt"
puts result
=> #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]
result = resource.clean_convert url: "http://bit.ly/2ih9aXt"
puts result
=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES
Speciális OCR-képességek a Ruby API-n keresztül
A nyílt forráskódú OcrSpace könyvtár néhány nagyon hasznos és fejlett funkciót tartalmaz a Ruby alkalmazásokon belüli OCR műveletek kezelésére. Pontosan képes felismerni a szöveget az alacsony felbontású képekből, a torzított szövegekből és még a kézzel írt tartalmakból is, így megbízható eredményeket biztosít a különböző forgatókönyvekben. A szövegkivonáson kívül a könyvtár lehetővé teszi a fejlesztők számára más fontos információk kinyerését is a dokumentumokból. Ez magában foglalja a felismert szöveg koordinátáinak lekérését, az oldalszámok észlelését és a dokumentumon belüli speciális érdeklődési területek azonosítását.
Hogyan lehet szöveget kivonni egy feltöltött fájlból Ruby API-n keresztül?
result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result #Raw result
=> #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}
result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result