Free Swift OCR Library to Perform OCR on Scanned Images & PDFs

Open Source Swift Optical Character Recognition (OCR) Library allows to Scan, Recognize, and Extract Text from Camera Photos Scanned Images & PDFs for free inside iOS and macOS

Kas ir SwiftyTesseract?

SwiftyTesseract ir pirmklasīga, atvērtā koda OCR bibliotēka, kas izstrādāta īpaši Swift ekosistēmai, ļaujot programmatūras izstrādātājiem vienkārši integrēt modernu optisko rakstzīmju atpazīšanu savās iOS un macOS lietotnēs. Izmantojot spēcīgu, nozarē pārbaudītu Tesseract OCR dzini, tā nodrošina intuitīvu un vienkāršu Swift interfeisu precīzai teksta izguvei no attēliem, skenētiem dokumentiem un dažādiem digitālajiem medijiem. Tas padara to par ideālu pamatu izstrādātājiem, kas veido gan vienkāršas teksta lasīšanas lietotnes, gan sarežģītus datu apstrādes rīkus, kam nepieciešama uzticama teksta skenēšanas un atpazīšanas funkcionalitāte Apple vidē.

Šī bibliotēka vienkāršo OCR integrāciju, aptverot Tesseract funkcionalitāti vienkāršā un izstrādātājiem draudzīgā API. Tā piedāvā plašu daudzveidību jau no sākuma, ieskaitot stabilu atbalstu vairākiem valodu komplektiem – būtisku funkciju starptautisku lietojumprogrammu izveidei. Lai nodrošinātu augstu precizitāti, SwiftyTesseract ietver būtiskas attēlu priekšapstrādes iespējas, kas uzlabo teksta skaidrību pirms atpazīšanas. Turklāt izstrādātāji var precīzi kontrolēt galvenās Tesseract konfigurācijas iespējas, piemēram, OCR dzinēja režīmu un lapas segmentācijas režīmu. Šī vienkāršības, daudzvalodu atbalsta un dziļas pielāgojamības kombinācija padara SwiftyTesseract par unikāli daudzpusīgu un spēcīgu rīku programmatūras izstrādātājiem, kas risina plašu teksta atpazīšanas projektu spektru.

Pārskats

Pārskats par SwiftyTesseract funkcijām.

Funkciju pārskats

Veikt OCR operācijas
Pievienot OCR iespējas
Atpazīt attēla tekstu
Attēla uz teksta eksportu
Atpazīt fonta tekstu
Meklēt PDF
Vairāk nekā 100 valodas
Izveidot OCR lietotnes
Saglabāt pārlūkā
Izvilkt tekstu
Vairāku pavedienu atbalsts
Atpazīt attēlu tekstu

SwiftyTesseract

SwiftyTesseract atbalsta populārus attēlu failu formātus, kas norādīti zemāk.

Lasītājs

PNG, JPEG, BMP, TIFF, TGA, DICOM

Rakstītājs

PNG, JPEG, BMP, TIFF

SwiftyTesseract

Platformas neatkarība

SwiftyTesseract var darboties ar jebkuru Swift balstītu programmēšanas valodu

Swift 4.1 un jaunāki.

SwiftyTesseract

Kā sākt darbu ar SwiftyTesseract

Ieteicamais veids, kā instalēt SwiftyTesseract, ir izmantot CocoaPods. Lūdzu, izmantojiet šo komandu, lai veiktu instalāciju.

Instalēt SwiftyTesseract caur CocoaPods

 pod 'SwiftyTesseract'

Jūs varat arī instalēt to manuāli; lejupielādējiet jaunākos izlaiduma failus tieši no GitHub krātuves.

Veiciet OCR attēlā, izmantojot Swift bibliotēku

Atvērtā koda SwiftyTesseract bibliotēka ļauj programmatūras izstrādātājiem viegli ielādēt dažādus attēlu tipus un veikt OCR operācijas atbilstoši savām vajadzībām Swift lietojumprogrammās. Jūs varat izmantot attēlu no savas lietotnes resursiem vai no jebkura cita avota. Bibliotēka spēj atpazīt tekstu dažādos fontos, tostarp Serif, Arial, Sans-serif un rokraksta fontos. Šeit ir paraugs ar koda fragmentu, kas parāda, kā izstrādātāji var atpazīt tekstu no attēla Swift lietojumprogrammās.

Kā atpazīt tekstu no attēla Swift lietojumprogrammās?

import SwiftyTesseract

// Load the image
let image = UIImage(named: "image.jpg")!

// Create a Tesseract instance
let tesseract = Tesseract()

// Set the language to English
tesseract.language = "eng"

// Set the image
tesseract.image = image

// Recognize the text
tesseract.recognize() { result in
    if let text = result.text {
        print("Recognized text: \(text)")
    } else {
        print("Error recognizing text")
    }
}

Attēlu priekšapstrādes atbalsts

SwiftyTesseract bibliotēka nodrošina pilnīgu atbalstu attēlu priekšapstrādei pirms OCR operāciju veikšanas Swift lietojumprogrammās. Piemēram, varat konvertēt attēlus uz pelēktoņu, mainīt izmērus vai regulēt kontrastu, novērst slīpumu, binarizēt un tā tālāk. Šeit ir piemērs, kā izstrādātāji var mainīt attēla izmērus pirms OCR. Šajā koda piemērā funkcija resizeImage maina attēla izmērus pirms tā apstrādes, kas ir noderīgi, strādājot ar augstas izšķirtspējas attēliem.

Kā veikt attēlu priekšapstrādi pirms OCR operācijām Swift lietojumprogrammās?

func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
    UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
    image.draw(in: CGRect(origin: .zero, size: newSize))
    let newImage = UIGraphicsGetImageFromCurrentImageContext()
    UIGraphicsEndImageContext()
    return newImage
}

if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
    tesseract.performOCR(on: resizedImage) { recognizedText in
        print("Resized Image OCR result: \(recognizedText ?? "No text found")")
    }
}

Vairāku valodu OCR operācijas, izmantojot Swift bibliotēku

Atvērtā koda SwiftyTesseract bibliotēka atbalsta teksta atpazīšanu vairāk nekā 100 valodās, tostarp angļu, spāņu, franču, vācu, ķīniešu un daudzās citās. Bibliotēkas inicializācijas laikā varat iestatīt vēlamo valodu(-as). Šī funkcija paplašina tās pielietojumu starptautiskiem lietotājiem un daudzvalodu apstrādes vajadzībām. Turklāt izstrādātāji var izveidot pielāgotus vārdnīcu, lai uzlabotu OCR procesa precizitāti. Šeit ir piemērs, kā konfigurēt bibliotēku angļu un spāņu valodām. Šis kods ļauj veikt OCR gan angļu, gan spāņu valodā, kas ir noderīgi, apstrādājot dokumentus ar jauktu valodu saturu.

Kā izvēlēties valodas vairāku valodu OCR operācijām Swift lietojumprogrammās?

let tesseract = SwiftyTesseract(language: [.english, .spanish])

Pielāgojami OCR parametri

Izmantojot atvērtā koda SwiftyTesseract bibliotēku, programmatūras izstrādātāji var pielāgot OCR iestatījumus, lai uzlabotu precizitāti konkrētiem dokumentu veidiem vai valodām. Tas ļauj izstrādātājiem precīzi noregulēt OCR apstrādi, padarot bibliotēku piemērotu unikāliem vai sarežģītiem OCR scenārijiem. Tas ietver iespēju norādīt valodas un OCR mainīgos atkarībā no dokumenta prasībām. Zemāk ir piemērs, kā izstrādātāji var pielāgot OCR dzinēja režīmu un lapas segmentācijas režīmu.

Kā pielāgot OCR dzinēja režīmu un lapas segmentācijas režīmu, izmantojot Swift API?

let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
    if let recognizedString = recognizedString {
        print("Recognized text with custom PSM: \(recognizedString)")
    }
}