1. Məhsullar
  2.   OCR
  3.   PHP
  4.   OcrPHP
 
  

Şəkil Mətnini Çoxsaylı Dillərdə Çıxarmaq üçün PHP Kitabxanası

Açıq mənbəli PHP Optik Simvol Tanıma API-si, PHP tətbiqlərində şəkilləri və ya sənədləri yükləməyə və skan etməyə, çoxsaylı dillərdə şəkillərdən mətn tanımağa və çıxarmağa imkan verir.

Optik Simvol Tanıma (OCR) texnologiyası bu günlərdə şəkillərdən və sənədlərdən mətn çıxarmaq üçün vacib bir alətə çevrilib. Rəqəmsal transformasiyanın artması ilə səmərəli və dəqiq OCR həllərinə tələbat heç vaxt bu qədər yüksək olmamışdı. OcrPHP, proqram tərtibatçılarına güclü və genişlənə bilən OCR tətbiqləri yaratmağa imkan verən çox güclü açıq mənbəli OCR kitabxanasıdır. Bu, Google tərəfindən hazırlanmış, geniş istifadə olunan və yüksək qiymətləndirilən Tesseract OCR mühərrikindən istifadə edən PHP‑əsaslı OCR kitabxanasıdır. Kitabxananın bir çox xüsusiyyətləri var, məsələn sənəd skan edilməsi, şəkillərdən mətn çıxarılması, müəyyən bir dildə mətn çıxarılması, PDF‑lərdən mətn çıxarılması və daha çox.

OcrPHP kitabxanası OCR dəqiqliyini artırmaq üçün dəvirlənmə, ləkə təmizləmə və ikiliyə çevirmə kimi qabaqcıl şəkil ön emal texnikalarını daxil edir. İngilis, İspan, Fransız, Alman, İtalyan, Portuqal, Çin, Yapon və daha bir çox dili dəstəkləyir. Proqram tərtibatçıları dili, səhifə seqmentasiya rejimini və OCR mühərrikinin ayarlarını tənzimləyərək OCR prosesini özəlləşdirə bilərlər. Kitabxana OCR əməliyyatlarının problemsiz və səmərəli icrasını təmin edən güclü səhv idarəetmə mexanizmlərinə malikdir. Çoxdilli dəstək, qabaqcıl şəkil skanı, özəl konfiqurasiyalar və sadə inteqrasiya kimi xüsusiyyətləri ilə tərtibatçılara az səy və aşağı maliyyətlə çoxfunksiyalı mətn tanıma alətləri yaratmağa imkan verir.

Previous Next

OcrPHP ilə Başlamaq

OcrPHP‑ni quraşdırmağın tövsiyə olunan yolu Composer‑dən istifadə etməkdir. Sorunsuz quraşdırma üçün aşağıdakı əmri işlədin.

Composer vasitəsilə OcrPHP‑ni quraşdırın

composer require fizzday/ocrphp

Github vasitəsilə OcrPHP‑ni quraşdırın

git clone https://github.com/fizzday/OcrPHP.git 

Komplektləşdirilmiş paylaşılan kitabxananı Github repozitoriyasından yükləyə bilərsiniz.

PHP vasitəsilə Şəkildən Mətn Tanımaq və Çıxarmaq

Açıq mənbəli OcrPHP kitabxanası, proqramların müxtəlif növ şəkilləri yükləməsini və bu şəkillərdən yalnız bir neçə PHP sətiri ilə mətn çıxarmasını asanlaşdırır. Aşağıdakı nümunə Imagick kitabxanasından istifadə edərək şəkil faylını yükləyir və OcrPHP sinifinin nümunəsini yaradır. Tərtibatçılar daha sonra dili və OCR mühərrikinin ayarlarını təyin edib, recognize() metodu ilə şəkil üzərində OCR icra edə bilərlər. Nəticədə getText() metodu ilə çıxarılan mətn çap olunur.

PHP Kitabxanası ilə Şəkildən Mətn Necə Çıxarılır?

require_once 'OcrPHP/autoload.php';

// Şəkil faylını yüklə
$image = new Imagick('path/to/image.jpg');

// OcrPHP sinifinin nümunəsini yarat
$ocr = new OcrPHP();

// Dil və OCR mühərrikinin ayarlarını təyin et
$ocr->setLanguage('eng');
$ocr->setPageSegmentationMode(OcrPHP::PSM_SINGLE_BLOCK);

// Şəkil üzərində OCR icra et
$result = $ocr->recognize($image);

// Çıxarılan mətnı çap et
echo $result->getText();

PHP vasitəsilə Müəyyən Dildə Mətn Tanımaq

OcrPHP kitabxanası, PHP tətbiqlərində OCR əməliyyatlarını yerinə yetirmək üçün bir neçə dili dəstəkləyir. Mətniniz İngilis, Çin və ya digər dəstəklənən dillərdən birindədirsə, OcrPHP onu problemsiz idarə edə bilər. Müəyyən bir dildə mətn çıxarmaq üçün dil kodunu parametr kimi ötürün. Müvafiq Tesseract dil modelinin quraşdırıldığından əmin olun. Aşağıdakı nümunə PHP tətbiqlərində Çin dilində şəkillərdən mətn çıxarmağı göstərir.

PHP vasitəsilə Çin Dilində Şəkildən Mətn Necə Çıxarılır?

require 'vendor/autoload.php';

use Fizzday\Ocr\Ocr;

$imagePath = __DIR__ . '/example-image-chinese.png';

$ocr = new Ocr();

// Çin dilində mətn çıxar
$text = $ocr->scan($imagePath, 'chi_sim'); // İngilis üçün 'eng' istifadə edin

echo "Çin Dilində Çıxarılan Mətn: \n" . $text;

PHP vasitəsilə Toplu Emal və OCR Avtomatlaşdırması

Sənəd emalı tətbiqləri yaradan proqram tərtibatçıları üçün toplu emal dəyərli bir xüsusiyyət ola bilər. Açıq mənbəli OcrPHP, tərtibatçılara bir qovluqdakı şəkil fayllarını dövr edərək hər birindən avtomatik olaraq mətn çıxarmağa imkan verir. Bu, fakturaları, qəbzləri və ya kitabları skan etmək kimi tapşırıqları avtomatlaşdırmaq üçün idealdır. Aşağıdakı nümunə göstərilən qovluqdakı bütün .png fayllarını skan edir, hər birindən mətn çıxarır və çap edir. Çıxışı fayla və ya verilənlər bazasına saxlamaq üçün genişləndirilə bilər, bu da sənəd emalı üçün güclü bir vasitədir.

PHP Kitabxanası ilə Birdən Çox Şəkildən Mətn Necə Çıxarılır?

require 'vendor/autoload.php';

use Fizzday\Ocr\Ocr;

$directory = __DIR__ . '/images/';
$ocr = new Ocr();

foreach (glob($directory . '*.png') as $imagePath) {
    $text = $ocr->scan($imagePath);
    echo "Mətn {$imagePath} üçün: \n" . $text . "\n\n";
}

Xüsusi Konfiqurasiya və İnteqrasiya Dəstəyi

Açıq mənbəli OcrPHP, PHP layihələrinə OCR imkanlarını inteqrasiya etməyi sadələşdirən çox yönlü və tərtibatçı‑dostu bir kitabxanadır. Kitabxana sizə dil, səhifə seqmentasiya rejimi və şəkil ön emal parametrləri kimi özəl Tesseract konfiqurasiyalarını təyin etməyə imkan verir, bu da OCR nəticələrini özəlləşdirməyə elastiklik verir.

 Azəri