Ilmainen Swift OCR -kirjasto OCR:n suorittamiseen skannatuissa kuvissa ja PDF-tiedostoissa
Avoimen lähdekoodin Swift-optinen tekstintunnistus (OCR) -kirjasto mahdollistaa skannauksen, tunnistamisen ja tekstin purkamisen kamerakuvista, skannatuista kuvista ja PDF-tiedostoista ilmaiseksi iOS- ja macOS-ympäristössä
Mikä on SwiftyTesseract?
SwiftyTesseract on huippuluokan, avoimen lähdekoodin OCR-kirjasto, joka on suunniteltu erityisesti Swift-ekosysteemille, ja jonka avulla ohjelmistokehittäjät voivat saumattomasti integroida kehittynyttä optista merkintunnistusta iOS- ja macOS-sovelluksiinsa. Hyödyntämällä tehokasta, teollisuudessa todistettua Tesseract OCR -moottoria, se tarjoaa intuitiivisen ja virtaviivaistetun Swift-käyttöliittymän tarkan tekstin poimintaan kuvista, skannatuista asiakirjoista ja erilaisesta digitaalisesta mediasta. Tämä tekee siitä ihanteellisen perustan kehittäjille, jotka rakentavat kaikkea yksinkertaisista tekstinlukutyökaluista monimutkaisiin datankäsittelyratkaisuihin, jotka vaativat luotettavaa tekstin skannausta ja tunnistusta Apple-ympäristössä.
Tämä kirjasto yksinkertaistaa OCR-integraatiota paketoimalla Tesseractin toiminnallisuuden suoraviivaiseen ja kehittäjäystävälliseen API:in. Se tarjoaa laajan monipuolisuuden heti alusta alkaen, mukaan lukien vahvan tuen useille kielille – kriittinen ominaisuus kansainvälisten sovellusten luomisessa. Korkean tarkkuuden varmistamiseksi SwiftyTesseract sisältää olennaisia kuvien esikäsittelyominaisuuksia, jotka parantavat tekstin selkeyttä ennen tunnistusta. Lisäksi kehittäjät säilyttävät tarkkaan säädettävän hallinnan mukauttamalla keskeisiä Tesseractin asetuksia, kuten OCR-moottorin tilaa ja sivun segmentointitilaa. Sen helppokäyttöisyyden, monikielituen ja syvän muokattavuuden yhdistelmä tekee SwiftyTesseractista ainutlaatuisen monipuolisen ja tehokkaan työkalun ohjelmistokehittäjille, jotka käsittelevät laajaa kirjoa tekstintunnistusprojekteja.
Aloittaminen SwiftyTesseractin kanssa
Suositeltu tapa asentaa SwiftyTesseract on käyttää CocoaPodsia. Käytä seuraavaa komentoa sujuvaa asennusta varten.
Asenna SwiftyTesseract CocoaPodsin kautta
pod 'SwiftyTesseract' Voit myös asentaa sen manuaalisesti; lataa uusimmat julkaisutiedostot suoraan GitHub -repositoriosta.
Suorita OCR-kuvaan Swift-kirjaston avulla
Avoimen lähdekoodin SwiftyTesseract-kirjasto tekee ohjelmistokehittäjille helppoa ladata erilaisia kuvia ja suorittaa OCR-toimintoja tarpeidensa mukaan Swift-sovelluksissa. Voit käyttää kuvaa sovelluksesi resursseista tai mistä tahansa lähteestä. Kirjasto voi tunnistaa tekstiä eri fonteissa, mukaan lukien Serif, Arial, Sans-serif ja käsinkirjoitetut fontit. Tässä on esimerkkikoodi, joka näyttää, miten ohjelmistokehittäjät voivat tunnistaa tekstiä kuvasta Swift-sovelluksissa.
Miten tunnistaa teksti kuvasta Swift-sovelluksissa?
import SwiftyTesseract
// Load the image
let image = UIImage(named: "image.jpg")!
// Create a Tesseract instance
let tesseract = Tesseract()
// Set the language to English
tesseract.language = "eng"
// Set the image
tesseract.image = image
// Recognize the text
tesseract.recognize() { result in
if let text = result.text {
print("Recognized text: \(text)")
} else {
print("Error recognizing text")
}
}
Kuvien esikäsittelyn tuki
SwiftyTesseract-kirjasto tarjoaa täyden tuen kuvien esikäsittelyyn ennen OCR-toimintojen suorittamista Swift-sovelluksissa. Esimerkiksi voit muuntaa kuvia harmaasävyiksi, muuttaa kokoa tai säätää kontrastia, poistaa kuvan vinouden, binarisointi jne. Tässä on esimerkki, joka näyttää, miten kehittäjät voivat muuttaa kuvan kokoa ennen OCR:n suorittamista. Tässä koodiesimerkissä resizeImage muuttaa kuvan koon ennen sen käsittelyä, mikä voi olla hyödyllistä työskenneltäessä korkearesoluutioisten kuvien kanssa.
Miten esikäsitellä kuvia ennen OCR-toimintoja Swift-sovelluksissa?
func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
image.draw(in: CGRect(origin: .zero, size: newSize))
let newImage = UIGraphicsGetImageFromCurrentImageContext()
UIGraphicsEndImageContext()
return newImage
}
if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
tesseract.performOCR(on: resizedImage) { recognizedText in
print("Resized Image OCR result: \(recognizedText ?? "No text found")")
}
}
Monikieliset OCR-toiminnot Swift-kirjaston avulla
Avoimen lähdekoodin SwiftyTesseract-kirjasto tukee tekstin tunnistamista yli 100 kielessä, mukaan lukien englanti, espanja, ranska, saksa, kiina ja monia muita. Voit asettaa haluamasi kielet kirjastoa alustettaessa. Tämä ominaisuus laajentaa sen sovellusaluetta kansainvälisille käyttäjille ja monikielisen käsittelyn vaatimuksille. Lisäksi kehittäjät voivat luoda omia sanakirjoja OCR-prosessin tarkkuuden parantamiseksi. Tässä on esimerkki kirjaston konfiguroinnista englanniksi ja espanjaksi. Tämä koodi mahdollistaa OCR:n sekä englanniksi että espanjaksi, mikä on hyödyllistä käsiteltäessä monikielistä sisältöä.
Miten valita kielet monikielisiä OCR-toimintoja varten Swift-sovelluksissa?
let tesseract = SwiftyTesseract(language: [.english, .spanish])
Mukautettavat OCR-parametrit
Avoimen lähdekoodin SwiftyTesseract-kirjaston avulla ohjelmistokehittäjillä on mahdollisuus mukauttaa OCR-asetuksia tarkkuuden parantamiseksi tietyntyyppisissä asiakirjoissa tai kielissä. Se antaa kehittäjille mahdollisuuden hienosäätää OCR-käsittelyä, jolloin kirjasto on sovellettavissa ainutlaatuisiin tai monimutkaisiin OCR-tilanteisiin. Tämä sisältää kyvyn määrittää kieliä ja OCR-muuttujia asiakirjan tarpeiden mukaan. Alla on esimerkki, joka näyttää, miten kehittäjät voivat mukauttaa OCR-moottorin tilaa ja sivun segmentointitilaa.
Miten mukauttaa OCR-moottorin tila ja sivun segmentointitila Swift API:n avulla?
let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
if let recognizedString = recognizedString {
print("Recognized text with custom PSM: \(recognizedString)")
}
}