Ilmainen Swift OCR -kirjasto OCR:n suorittamiseen skannatuissa kuvissa ja PDF-tiedostoissa

Avoimen lähdekoodin Swift-optinen tekstintunnistus (OCR) -kirjasto mahdollistaa skannauksen, tunnistamisen ja tekstin purkamisen kamerakuvista, skannatuista kuvista ja PDF-tiedostoista ilmaiseksi iOS- ja macOS-ympäristössä

Mikä on SwiftyTesseract?

SwiftyTesseract on huippuluokan, avoimen lähdekoodin OCR-kirjasto, joka on suunniteltu erityisesti Swift-ekosysteemille, ja jonka avulla ohjelmistokehittäjät voivat saumattomasti integroida kehittynyttä optista merkintunnistusta iOS- ja macOS-sovelluksiinsa. Hyödyntämällä tehokasta, teollisuudessa todistettua Tesseract OCR -moottoria, se tarjoaa intuitiivisen ja virtaviivaistetun Swift-käyttöliittymän tarkan tekstin poimintaan kuvista, skannatuista asiakirjoista ja erilaisesta digitaalisesta mediasta. Tämä tekee siitä ihanteellisen perustan kehittäjille, jotka rakentavat kaikkea yksinkertaisista tekstinlukutyökaluista monimutkaisiin datankäsittelyratkaisuihin, jotka vaativat luotettavaa tekstin skannausta ja tunnistusta Apple-ympäristössä.

Tämä kirjasto yksinkertaistaa OCR-integraatiota paketoimalla Tesseractin toiminnallisuuden suoraviivaiseen ja kehittäjäystävälliseen API:in. Se tarjoaa laajan monipuolisuuden heti alusta alkaen, mukaan lukien vahvan tuen useille kielille – kriittinen ominaisuus kansainvälisten sovellusten luomisessa. Korkean tarkkuuden varmistamiseksi SwiftyTesseract sisältää olennaisia kuvien esikäsittelyominaisuuksia, jotka parantavat tekstin selkeyttä ennen tunnistusta. Lisäksi kehittäjät säilyttävät tarkkaan säädettävän hallinnan mukauttamalla keskeisiä Tesseractin asetuksia, kuten OCR-moottorin tilaa ja sivun segmentointitilaa. Sen helppokäyttöisyyden, monikielituen ja syvän muokattavuuden yhdistelmä tekee SwiftyTesseractista ainutlaatuisen monipuolisen ja tehokkaan työkalun ohjelmistokehittäjille, jotka käsittelevät laajaa kirjoa tekstintunnistusprojekteja.

Yleiskatsaus

Katsaus SwiftyTesseractin ominaisuuksiin.

Ominaisuuksien yleiskatsaus

Suorita OCR-toimintoja
Lisää OCR-ominaisuuksia
Tunnista kuvan teksti
Kuvan tekstiin vienti
Tunnista fonttiteksti
Hae PDF:stä
Yli 100 kieltä
Luo OCR-sovelluksia
Tallenna selaimeen
Poimi teksti
Monisäikeinen tuki
Tunnista kuvien teksti

SwiftyTesseract

SwiftyTesseract tukee alla lueteltuja suosittuja kuvatiedostomuotoja.

Lukija

PNG, JPEG, BMP, TIFF, TGA, DICOM

Kirjoittaja

PNG, JPEG, BMP, TIFF

SwiftyTesseract

Alustariippumattomuus

SwiftyTesseract voi toimia minkä tahansa Swift-pohjaisen ohjelmointikielen kanssa

Swift 4.1 ja uudemmat.

SwiftyTesseract

Aloittaminen SwiftyTesseractin kanssa

Suositeltu tapa asentaa SwiftyTesseract on käyttää CocoaPodsia. Käytä seuraavaa komentoa sujuvaa asennusta varten.

Asenna SwiftyTesseract CocoaPodsin kautta

 pod 'SwiftyTesseract'

Voit myös asentaa sen manuaalisesti; lataa uusimmat julkaisutiedostot suoraan GitHub -repositoriosta.

Suorita OCR-kuvaan Swift-kirjaston avulla

Avoimen lähdekoodin SwiftyTesseract-kirjasto tekee ohjelmistokehittäjille helppoa ladata erilaisia kuvia ja suorittaa OCR-toimintoja tarpeidensa mukaan Swift-sovelluksissa. Voit käyttää kuvaa sovelluksesi resursseista tai mistä tahansa lähteestä. Kirjasto voi tunnistaa tekstiä eri fonteissa, mukaan lukien Serif, Arial, Sans-serif ja käsinkirjoitetut fontit. Tässä on esimerkkikoodi, joka näyttää, miten ohjelmistokehittäjät voivat tunnistaa tekstiä kuvasta Swift-sovelluksissa.

Miten tunnistaa teksti kuvasta Swift-sovelluksissa?

import SwiftyTesseract

// Load the image
let image = UIImage(named: "image.jpg")!

// Create a Tesseract instance
let tesseract = Tesseract()

// Set the language to English
tesseract.language = "eng"

// Set the image
tesseract.image = image

// Recognize the text
tesseract.recognize() { result in
    if let text = result.text {
        print("Recognized text: \(text)")
    } else {
        print("Error recognizing text")
    }
}

Kuvien esikäsittelyn tuki

SwiftyTesseract-kirjasto tarjoaa täyden tuen kuvien esikäsittelyyn ennen OCR-toimintojen suorittamista Swift-sovelluksissa. Esimerkiksi voit muuntaa kuvia harmaasävyiksi, muuttaa kokoa tai säätää kontrastia, poistaa kuvan vinouden, binarisointi jne. Tässä on esimerkki, joka näyttää, miten kehittäjät voivat muuttaa kuvan kokoa ennen OCR:n suorittamista. Tässä koodiesimerkissä resizeImage muuttaa kuvan koon ennen sen käsittelyä, mikä voi olla hyödyllistä työskenneltäessä korkearesoluutioisten kuvien kanssa.

Miten esikäsitellä kuvia ennen OCR-toimintoja Swift-sovelluksissa?

func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
    UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
    image.draw(in: CGRect(origin: .zero, size: newSize))
    let newImage = UIGraphicsGetImageFromCurrentImageContext()
    UIGraphicsEndImageContext()
    return newImage
}

if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
    tesseract.performOCR(on: resizedImage) { recognizedText in
        print("Resized Image OCR result: \(recognizedText ?? "No text found")")
    }
}

Monikieliset OCR-toiminnot Swift-kirjaston avulla

Avoimen lähdekoodin SwiftyTesseract-kirjasto tukee tekstin tunnistamista yli 100 kielessä, mukaan lukien englanti, espanja, ranska, saksa, kiina ja monia muita. Voit asettaa haluamasi kielet kirjastoa alustettaessa. Tämä ominaisuus laajentaa sen sovellusaluetta kansainvälisille käyttäjille ja monikielisen käsittelyn vaatimuksille. Lisäksi kehittäjät voivat luoda omia sanakirjoja OCR-prosessin tarkkuuden parantamiseksi. Tässä on esimerkki kirjaston konfiguroinnista englanniksi ja espanjaksi. Tämä koodi mahdollistaa OCR:n sekä englanniksi että espanjaksi, mikä on hyödyllistä käsiteltäessä monikielistä sisältöä.

Miten valita kielet monikielisiä OCR-toimintoja varten Swift-sovelluksissa?

let tesseract = SwiftyTesseract(language: [.english, .spanish])

Mukautettavat OCR-parametrit

Avoimen lähdekoodin SwiftyTesseract-kirjaston avulla ohjelmistokehittäjillä on mahdollisuus mukauttaa OCR-asetuksia tarkkuuden parantamiseksi tietyntyyppisissä asiakirjoissa tai kielissä. Se antaa kehittäjille mahdollisuuden hienosäätää OCR-käsittelyä, jolloin kirjasto on sovellettavissa ainutlaatuisiin tai monimutkaisiin OCR-tilanteisiin. Tämä sisältää kyvyn määrittää kieliä ja OCR-muuttujia asiakirjan tarpeiden mukaan. Alla on esimerkki, joka näyttää, miten kehittäjät voivat mukauttaa OCR-moottorin tilaa ja sivun segmentointitilaa.

Miten mukauttaa OCR-moottorin tila ja sivun segmentointitila Swift API:n avulla?

let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
    if let recognizedString = recognizedString {
        print("Recognized text with custom PSM: \(recognizedString)")
    }
}