Leabharlann PHP chun Téacs Íomhá a Bhain i dteangacha iolracha
Ceadaíonn API Aithint Carachtar Optúil PHP foinse oscailte íomhánna nó cáipéisí a luchtú & scanadh, téacs a aithint & a bhaint as íomhánna i dteangacha iolracha laistigh de fheidhmchláir PHP.
Tá teicneolaíocht Aithint Carachtar Optúil (OCR) tar éis éirí mar uirlis riachtanach chun téacs a bhaint as íomhánna agus cáipéisí sa lá atá inniu ann. Le méadú an trasfhoirmithe digiteacha, ní raibh gá níos mó le réiteach OCR éifeachtach agus cruinn. Is leabharlann OCR foinse oscailte an-chumhachtach é OcrPHP a chuireann ar chumas forbróirí bogearraí feidhmchláir OCR láidre agus inscálaithe a thógáil. Is leabharlann OCR bunaithe ar PHP í a úsáideann an t‑inneall Tesseract OCR, teicneolaíocht OCR forleathan úsáidte agus an‑aitheanta a fhorbair Google. Tá go leor gnéithe san leabharlann, mar shampla scanadh cáipéisí, bailiú téacs ó íomhánna, bailiú téacs i dteanga ar leith, bailiú téacs ó PDFanna, agus i bhfad níos mó.
I gcuimhnigh go bhfuil teicnící casta réamhphróiseála íomhánna san leabharlann OcrPHP, mar shampla díchéimniú, díshcrúbáil, agus binárú, chun cruinneas OCR a fheabhsú. Tacaíonn sé le feidhmiú OCR i dteangacha iolracha, lena n-áirítear Béarla, Spáinnis, Fraincis, Gearmáinis, Iodáilis, Portaingéilis, Sínis, Seapáinis, agus go leor eile. Is féidir le forbróirí bogearraí an próiseas OCR a shaincheapadh trí pharaiméadair a choigeartú, mar shampla teanga, mód deighilt leathanaigh, agus socruithe an innill OCR. Tá meicníochtaí láidir láimhseála earráidí curtha san áireamh chun a chinntiú go ndéantar na hoibríochtaí OCR go réidh agus go héifeachtach. Le gnéithe mar thacaíocht ilteangach, scanadh íomhá casta, cumraíochtaí saincheaptha, agus comhtháthú simplí, cuireann sé ar chumas forbróirí uirlisí aithint téacs ilúsáideacha a chruthú le iarracht íseal agus costas íseal.
Ag Tosú le OcrPHP
Is é an bealach molta chun OcrPHP a shuiteáil ag baint úsáide as Composer. Úsáid an t‑ordú seo a leanas le haghaidh suiteáil réidh.
Suiteáil OcrPHP trí Composer
composer require fizzday/ocrphpSuiteáil OcrPHP trí Github
git clone https://github.com/fizzday/OcrPHP.git Is féidir leat an leabharlann roinnte tiomsaithe a íoslódáil ón stór Github.
Aithin agus Bain Téacs ó Íomhá trí PHP
Cuireann leabharlann OcrPHP foinse oscailte ar chumas bogearraí íomhánna de chineálacha éagsúla a luchtú agus téacs a bhaint as na híomhánna sin le cúpla líne cód PHP. Seo sampla an-choitianta a úsáideann leabharlann Imagick chun comhad íomhá a luchtú agus cás den rang OcrPHP a chruthú. Ansin is féidir le forbróirí an teanga agus socruithe an innill OCR a shocrú sula ndéantar OCR ar an íomhá ag baint úsáide as an modh recognize(). Ar deireadh, priontálann sé an téacs a bhaintear amach ag baint úsáide as an modh getText().
Conas Téacs a Bhain Trí Leabharlann PHP?
require_once 'OcrPHP/autoload.php';
// Luchtaigh an comhad íomhá
$image = new Imagick('path/to/image.jpg');
// Cruthaigh cás den rang OcrPHP
$ocr = new OcrPHP();
// Socraigh an teanga agus socruithe an innill OCR
$ocr->setLanguage('eng');
$ocr->setPageSegmentationMode(OcrPHP::PSM_SINGLE_BLOCK);
// Déan OCR ar an íomhá
$result = $ocr->recognize($image);
// Priontáil an téacs a bhaintear amach
echo $result->getText();
Aithin Téacs i dTeanga Sonrach trí PHP
Tá tacaíocht ag leabharlann OcrPHP do iltheangacha chun oibríochtaí OCR a chur i bhfeidhm i bhfeidhmchláir PHP. Bíodh do théacs i mBéarla, Sínis, nó i dteanga eile a dtacaítear leis, is féidir le OcrPHP é a láimhseáil gan deacracht. Chun téacs a bhaint i dteanga ar leith, tabhair an cód teanga mar pharaiméadar. Cinntigh go bhfuil an tsamhail teanga Tesseract ábhartha suiteáilte. Taispeánann an sampla thíos conas forbróirí téacs a bhaint as íomhá i dteanga Sínise laistigh de fheidhmchláir PHP.
Conas Téacs a Bhain Trí Íomhá i dTeanga Sínise trí PHP?
require 'vendor/autoload.php';
use Fizzday\Ocr\Ocr;
$imagePath = __DIR__ . '/example-image-chinese.png';
$ocr = new Ocr();
// Bain téacs i Sínis
$text = $ocr->scan($imagePath, 'chi_sim'); // Úsáid 'eng' le haghaidh Béarla
echo "Téacs a Bhaintear Amach (Sínis): \n" . $text;
Próiseáil Baiscéil agus Uathoibriú OCR trí PHP
Do fhorbróirí bogearraí a thógann feidhmchláir próiseála cáipéisí, is gné luachmhar é próiseáil baiscéil. Cuireann OcrPHP foinse oscailte ar chumas forbróirí comhadlann íomhánna a léim tríd agus téacs a bhaint as gach ceann de ghnáth go huathoibríoch. Tá sé foirfe le haghaidh uathoibriú tascanna cosúil le scanadh sonrasáin, admhálacha, nó leabhair. Seo sampla an-úsáideach a scanann gach comhad .png san eolaire sonraithe, téacs a bhaint as gach ceann acu, agus é a phriontáil. Is féidir leat an t-aschur a shábháil i gcomhad nó i bhunachar sonraí, rud a fhágann gur uirlis chumhachtach é le haghaidh próiseála cáipéisí.
Conas Téacs a Bhain Trí Íomhánna Iolracha trí Leabharlann PHP?
require 'vendor/autoload.php';
use Fizzday\Ocr\Ocr;
$directory = __DIR__ . '/images/';
$ocr = new Ocr();
foreach (glob($directory . '*.png') as $imagePath) {
$text = $ocr->scan($imagePath);
echo "Téacs ó {$imagePath}: \n" . $text . "\n\n";
}
Cumraíocht Saincheaptha & Tacaíocht Comhtháthaithe
Is leabharlann ilúsáidteach agus cairdiúil don fhorbróir é OcrPHP foinse oscailte a shimpliúint a chomhtháthú le cumais OCR i dtionscadail PHP. Ligeann an leabharlann duit cumraíochtaí Tesseract saincheaptha a shonrú, mar shampla teanga, mód deighilt leathanaigh, agus paraiméadair réamhphróiseála íomhá, rud a sholáthraíonn solúbthacht chun torthaí OCR a oiriúnú.