Ingyenes Swift OCR Könyvtár OCR végrehajtásához beolvasott képeken és PDF-eken

Nyílt forráskódú Swift Optikai Karakterfelismerő (OCR) könyvtár, amely ingyenes szkennelést, felismerést és szöveg kinyerést tesz lehetővé a kamera fotóiból, beolvasott képekből és PDF-ekből iOS-en és macOS-en

Mi a SwiftyTesseract?

A SwiftyTesseract egy elsőrangú, nyílt forráskódú OCR könyvtár, amely kifejezetten a Swift ökoszisztémára lett tervezve, és lehetővé teszi a szoftverfejlesztők számára, hogy zökkenőmentesen integrálják a kifinomult optikai karakterfelismerést iOS és macOS alkalmazásaikba. A hatékony, iparág által bizonyított Tesseract OCR motor kihasználásával intuitív és letisztult Swift felületet biztosít a szöveg pontos kinyeréséhez képekből, beolvasott dokumentumokból és különféle digitális médiából. Ez ideális alapot nyújt a fejlesztőknek, akik egyszerű szövegolvasó segédprogramoktól egészen összetett adatfeldolgozó eszközökig terjedő megoldásokat építenek, és megbízható szöveg‑szkennelési és felismerési képességekre van szükségük az Apple környezetben.

Ez a könyvtár leegyszerűsíti az OCR integrációt azáltal, hogy a Tesseract funkcionalitását egy egyszerű, fejlesztőbarát API‑ba csomagolja. Késztermékként széles körű sokoldalúságot kínál, többek között robusztus többnyelvű támogatást – ami kulcsfontosságú a nemzetközi alkalmazások fejlesztésénél. A magas pontosság érdekében a SwiftyTesseract alapvető képelőfeldolgozó képességeket is tartalmaz, amelyek a szöveg tisztaságát javítják a felismerés előtt. Emellett a fejlesztők finomhangolhatják a Tesseract kulcsfontosságú konfigurációs beállításait, például az OCR motor módját és az oldalszegmentálási módot. Az egyszerű használat, a többnyelvű támogatás és a mély testreszabhatóság kombinációja a SwiftyTesseract‑ot egyedülállóan sokoldalúvá és erőteljessé teszi a szövegfelismerési projektek széles skálájának megvalósításához.

Áttekintés

A SwiftyTesseract funkcióinak áttekintése.

Funkciók áttekintése

OCR műveletek végrehajtása
OCR képességek hozzáadása
Képek szövegének felismerése
Kép‑szöveg export
Betűtípus‑szöveg felismerése
PDF keresés
Több mint 100 nyelv
OCR alkalmazások létrehozása
Mentés böngészőbe
Szöveg kinyerése
Többszálú támogatás
Képek szövegének felismerése

SwiftyTesseract

A SwiftyTesseract támogatja az alább felsorolt népszerű képformátumokat.

Olvasó

PNG, JPEG, BMP, TIFF, TGA, DICOM

Író

PNG, JPEG, BMP, TIFF

SwiftyTesseract

Platformfüggetlenség

A SwiftyTesseract bármely Swift‑alapú programnyelvvel működik

Swift 4.1 és újabb verziók.

SwiftyTesseract

A SwiftyTesseract használatának megkezdése

A SwiftyTesseract telepítésének ajánlott módja a CocoaPods használata. Kérjük, futtassa az alábbi parancsot a zökkenőmentes telepítéshez.

Telepítés CocoaPods‑on keresztül

 pod 'SwiftyTesseract'

Manuálisan is telepíthető; a legújabb kiadási fájlokat letöltheti közvetlenül a GitHub tárolóból.

OCR végrehajtása képen Swift könyvtárral

A nyílt forráskódú SwiftyTesseract könyvtár egyszerűvé teszi a fejlesztők számára, hogy különböző típusú képeket töltsenek be, és igényeiknek megfelelő OCR műveletet hajtsanak végre Swift‑alkalmazásokban. Használhat képet az alkalmazás erőforrásaiból vagy bármely más forrásból. A könyvtár felismeri a szöveget különböző betűtípusokban, beleértve a Serif, Arial, Sans‑serif és kézírási betűtípusokat is. Az alábbi mintakód bemutatja, hogyan ismerhet fel a fejlesztő szöveget egy képről Swift‑alkalmazásban.

Hogyan ismerhető fel szöveg egy képről Swift‑alkalmazásokban?

import SwiftyTesseract

// Kép betöltése
let image = UIImage(named: "image.jpg")!

// Tesseract példány létrehozása
let tesseract = Tesseract()

// Nyelv beállítása angolra
tesseract.language = "eng"

// Kép beállítása
tesseract.image = image

// Szöveg felismerése
tesseract.recognize() { result in
    if let text = result.text {
        print("Felismerett szöveg: \(text)")
    } else {
        print("Hiba a szöveg felismerésekor")
    }
}

Képelőfeldolgozás támogatása

A SwiftyTesseract könyvtár teljes körű támogatást nyújt a képek előfeldolgozásához, mielőtt OCR műveleteket hajtanánk végre Swift‑alkalmazásokban. Például konvertálhatja a képeket szürkeárnyalatosra, átméretezheti vagy módosíthatja a kontrasztot, kiegyenesítheti a képet, binarizálhatja stb. Az alábbi példa bemutatja, hogyan méretezhetünk át egy képet OCR előtt. Ebben a kódban a resizeImage átméretezi a képet a feldolgozás előtt, ami hasznos lehet nagy felbontású képek esetén.

Hogyan előfeldolgozzuk a képeket OCR műveletek előtt Swift‑alkalmazásokban?

func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
    UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
    image.draw(in: CGRect(origin: .zero, size: newSize))
    let newImage = UIGraphicsGetImageFromCurrentImageContext()
    UIGraphicsEndImageContext()
    return newImage
}

if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
    tesseract.performOCR(on: resizedImage) { recognizedText in
        print("Átméretezett kép OCR eredménye: \(recognizedText ?? "Nem található szöveg")")
    }
}

Többnyelvű OCR műveletek Swift könyvtárral

A nyílt forráskódú SwiftyTesseract könyvtár több mint 100 nyelven képes felismerni a szöveget, többek között angolul, spanyolul, franciául, németül, kínaiul és sok más nyelven. A nyelvet a könyvtár inicializálásakor állíthatja be. Ez a funkció szélesíti a nemzetközi felhasználók és a többnyelvű feldolgozási igények körét. Emellett a fejlesztők egyedi szótárakat hozhatnak létre az OCR pontosságának javítása érdekében. Az alábbi példa az angol és spanyol nyelvek konfigurálását mutatja be. Ez a kód lehetővé teszi az OCR használatát mindkét nyelven, ami hasznos vegyes nyelvű dokumentumok feldolgozásakor.

Hogyan válasszuk ki a nyelveket többnyelvű OCR műveletekhez Swift‑alkalmazásokban?

let tesseract = SwiftyTesseract(language: [.english, .spanish])

Testreszabható OCR paraméterek

A nyílt forráskódú SwiftyTesseract könyvtár segítségével a fejlesztők testreszabhatják az OCR beállításait, hogy javítsák a pontosságot adott dokumentumtípusok vagy nyelvek esetén. Lehetővé teszi az OCR feldolgozás finomhangolását, így a könyvtár alkalmazkodik egyedi vagy összetett OCR forgatókönyvekhez. Ide tartozik a nyelvek és OCR változók megadása a dokumentum igényei szerint. Az alábbi példa bemutatja, hogyan testreszabható az OCR motor módja és az oldalszegmentálási mód.

Hogyan testreszabjuk az OCR motor módját és az oldalszegmentálási módot Swift API‑n keresztül?

let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
    if let recognizedString = recognizedString {
        print("Felismerett szöveg egyedi PSM‑mel: \(recognizedString)")
    }
}