Free Swift OCR Library to Perform OCR on Scanned Images & PDFs
Open Source Swift Optical Character Recognition (OCR) Library allows to Scan, Recognize, and Extract Text from Camera Photos Scanned Images & PDFs for free inside iOS and macOS
Kas ir SwiftyTesseract?
SwiftyTesseract ir pirmklasīga, atvērtā koda OCR bibliotēka, kas izstrādāta īpaši Swift ekosistēmai, ļaujot programmatūras izstrādātājiem vienkārši integrēt modernu optisko rakstzīmju atpazīšanu savās iOS un macOS lietotnēs. Izmantojot spēcīgu, nozarē pārbaudītu Tesseract OCR dzini, tā nodrošina intuitīvu un vienkāršu Swift interfeisu precīzai teksta izguvei no attēliem, skenētiem dokumentiem un dažādiem digitālajiem medijiem. Tas padara to par ideālu pamatu izstrādātājiem, kas veido gan vienkāršas teksta lasīšanas lietotnes, gan sarežģītus datu apstrādes rīkus, kam nepieciešama uzticama teksta skenēšanas un atpazīšanas funkcionalitāte Apple vidē.
Šī bibliotēka vienkāršo OCR integrāciju, aptverot Tesseract funkcionalitāti vienkāršā un izstrādātājiem draudzīgā API. Tā piedāvā plašu daudzveidību jau no sākuma, ieskaitot stabilu atbalstu vairākiem valodu komplektiem – būtisku funkciju starptautisku lietojumprogrammu izveidei. Lai nodrošinātu augstu precizitāti, SwiftyTesseract ietver būtiskas attēlu priekšapstrādes iespējas, kas uzlabo teksta skaidrību pirms atpazīšanas. Turklāt izstrādātāji var precīzi kontrolēt galvenās Tesseract konfigurācijas iespējas, piemēram, OCR dzinēja režīmu un lapas segmentācijas režīmu. Šī vienkāršības, daudzvalodu atbalsta un dziļas pielāgojamības kombinācija padara SwiftyTesseract par unikāli daudzpusīgu un spēcīgu rīku programmatūras izstrādātājiem, kas risina plašu teksta atpazīšanas projektu spektru.
Kā sākt darbu ar SwiftyTesseract
Ieteicamais veids, kā instalēt SwiftyTesseract, ir izmantot CocoaPods. Lūdzu, izmantojiet šo komandu, lai veiktu instalāciju.
Instalēt SwiftyTesseract caur CocoaPods
pod 'SwiftyTesseract' Jūs varat arī instalēt to manuāli; lejupielādējiet jaunākos izlaiduma failus tieši no GitHub krātuves.
Veiciet OCR attēlā, izmantojot Swift bibliotēku
Atvērtā koda SwiftyTesseract bibliotēka ļauj programmatūras izstrādātājiem viegli ielādēt dažādus attēlu tipus un veikt OCR operācijas atbilstoši savām vajadzībām Swift lietojumprogrammās. Jūs varat izmantot attēlu no savas lietotnes resursiem vai no jebkura cita avota. Bibliotēka spēj atpazīt tekstu dažādos fontos, tostarp Serif, Arial, Sans-serif un rokraksta fontos. Šeit ir paraugs ar koda fragmentu, kas parāda, kā izstrādātāji var atpazīt tekstu no attēla Swift lietojumprogrammās.
Kā atpazīt tekstu no attēla Swift lietojumprogrammās?
import SwiftyTesseract
// Load the image
let image = UIImage(named: "image.jpg")!
// Create a Tesseract instance
let tesseract = Tesseract()
// Set the language to English
tesseract.language = "eng"
// Set the image
tesseract.image = image
// Recognize the text
tesseract.recognize() { result in
if let text = result.text {
print("Recognized text: \(text)")
} else {
print("Error recognizing text")
}
}
Attēlu priekšapstrādes atbalsts
SwiftyTesseract bibliotēka nodrošina pilnīgu atbalstu attēlu priekšapstrādei pirms OCR operāciju veikšanas Swift lietojumprogrammās. Piemēram, varat konvertēt attēlus uz pelēktoņu, mainīt izmērus vai regulēt kontrastu, novērst slīpumu, binarizēt un tā tālāk. Šeit ir piemērs, kā izstrādātāji var mainīt attēla izmērus pirms OCR. Šajā koda piemērā funkcija resizeImage maina attēla izmērus pirms tā apstrādes, kas ir noderīgi, strādājot ar augstas izšķirtspējas attēliem.
Kā veikt attēlu priekšapstrādi pirms OCR operācijām Swift lietojumprogrammās?
func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
image.draw(in: CGRect(origin: .zero, size: newSize))
let newImage = UIGraphicsGetImageFromCurrentImageContext()
UIGraphicsEndImageContext()
return newImage
}
if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
tesseract.performOCR(on: resizedImage) { recognizedText in
print("Resized Image OCR result: \(recognizedText ?? "No text found")")
}
}
Vairāku valodu OCR operācijas, izmantojot Swift bibliotēku
Atvērtā koda SwiftyTesseract bibliotēka atbalsta teksta atpazīšanu vairāk nekā 100 valodās, tostarp angļu, spāņu, franču, vācu, ķīniešu un daudzās citās. Bibliotēkas inicializācijas laikā varat iestatīt vēlamo valodu(-as). Šī funkcija paplašina tās pielietojumu starptautiskiem lietotājiem un daudzvalodu apstrādes vajadzībām. Turklāt izstrādātāji var izveidot pielāgotus vārdnīcu, lai uzlabotu OCR procesa precizitāti. Šeit ir piemērs, kā konfigurēt bibliotēku angļu un spāņu valodām. Šis kods ļauj veikt OCR gan angļu, gan spāņu valodā, kas ir noderīgi, apstrādājot dokumentus ar jauktu valodu saturu.
Kā izvēlēties valodas vairāku valodu OCR operācijām Swift lietojumprogrammās?
let tesseract = SwiftyTesseract(language: [.english, .spanish])
Pielāgojami OCR parametri
Izmantojot atvērtā koda SwiftyTesseract bibliotēku, programmatūras izstrādātāji var pielāgot OCR iestatījumus, lai uzlabotu precizitāti konkrētiem dokumentu veidiem vai valodām. Tas ļauj izstrādātājiem precīzi noregulēt OCR apstrādi, padarot bibliotēku piemērotu unikāliem vai sarežģītiem OCR scenārijiem. Tas ietver iespēju norādīt valodas un OCR mainīgos atkarībā no dokumenta prasībām. Zemāk ir piemērs, kā izstrādātāji var pielāgot OCR dzinēja režīmu un lapas segmentācijas režīmu.
Kā pielāgot OCR dzinēja režīmu un lapas segmentācijas režīmu, izmantojot Swift API?
let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
if let recognizedString = recognizedString {
print("Recognized text with custom PSM: \(recognizedString)")
}
}