1. Ürün:% s
  2.   OCR
  3.   PHP
  4.   OcrPHP
 
  

PHP Kütüphanesi ile Görüntü Metnini Birden Çok Dilde Çıkar

Açık Kaynak PHP Optik Karakter Tanıma API'si, PHP uygulamaları içinde Görüntüleri veya Belgeleri Yükleyip Taramaya, Metni Tanımaya ve Birden Çok Dilde Çıkarmaya olanak tanır.

Optik Karakter Tanıma (OCR) teknolojisi, günümüzde görüntülerden ve belgelerden metin çıkarmak için vazgeçilmez bir araç haline gelmiştir. Dijital dönüşümün yükselişiyle, etkili ve doğru OCR çözümlerine olan ihtiyaç hiç bu kadar acil olmamıştı. OcrPHP, yazılım geliştiricilerin sağlam ve ölçeklenebilir OCR uygulamaları oluşturmasını sağlayan çok güçlü bir açık kaynak OCR kütüphanesidir. Google tarafından geliştirilen, yaygın olarak kullanılan ve yüksek itibara sahip OCR teknolojisi Tesseract OCR motorunu kullanan PHP tabanlı bir OCR kütüphanesidir. Kütüphane, belge tarama, görüntülerden metin çıkarma, belirli bir dilde metin çıkarma, PDF’lerden metin çıkarma ve daha birçok özelliği içerir.

OcrPHP kütüphanesi, OCR doğruluğunu artırmak için eğikliği düzeltme, lekeleri giderme ve ikilileştirme gibi gelişmiş görüntü ön işleme tekniklerini içermektedir. İngilizce, İspanyolca, Fransızca, Almanca, İtalyanca, Portekizce, Çince, Japonca ve daha birçok dili destekleyerek çoklu dilde OCR gerçekleştirebilir. Yazılım geliştiricileri, dili, sayfa segmentasyon modunu ve OCR motoru ayarlarını gibi parametreleri ayarlayarak OCR sürecini özelleştirebilir. Sağlam hata yönetimi mekanizmaları, OCR işlemlerinin sorunsuz ve verimli bir şekilde yürütülmesini sağlar. Çoklu dil desteği, gelişmiş görüntü tarama, özel yapılandırmalar ve basit entegrasyon gibi özelliklerle, geliştiricilerin az çaba ve düşük maliyetle çok yönlü metin tanıma araçları oluşturmasını mümkün kılar.

Previous Next

OcrPHP ile Başlarken

OcrPHP'yi kurmanın önerilen yolu Composer kullanmaktır. Sorunsuz bir kurulum için aşağıdaki komutu kullanın.

Composer ile OcrPHP Kurulumu

composer require fizzday/ocrphp

Github üzerinden OcrPHP Kurulumu

git clone https://github.com/fizzday/OcrPHP.git 

Derlenmiş paylaşımlı kütüphaneyi Github deposundan indirebilirsiniz.

PHP ile Bir Görüntüden Metni Tanıma ve Çıkarma

Açık kaynak OcrPHP kütüphanesi, yazılımların çeşitli görüntü tiplerini yüklemesini ve bu görüntülerden sadece birkaç PHP satırıyla metin çıkarmasını kolaylaştırır. Aşağıda Imagick kütüphanesini kullanarak bir görüntü dosyasını yükleyen ve OcrPHP sınıfının bir örneğini oluşturan çok basit bir örnek bulunmaktadır. Geliştiriciler, ardından dili ve OCR motoru ayarlarını belirleyebilir, recognize() yöntemiyle görüntü üzerinde OCR gerçekleştirebilir ve sonunda getText() yöntemiyle çıkarılan metni yazdırabilir.

PHP Kütüphanesi ile Bir Görüntüden Metin Nasıl Çıkarılır?

require_once 'OcrPHP/autoload.php';

// Görüntü dosyasını yükle
$image = new Imagick('path/to/image.jpg');

// OcrPHP sınıfının bir örneğini oluştur
$ocr = new OcrPHP();

// Dil ve OCR motoru ayarlarını belirle
$ocr->setLanguage('eng');
$ocr->setPageSegmentationMode(OcrPHP::PSM_SINGLE_BLOCK);

// Görüntü üzerinde OCR gerçekleştir
$result = $ocr->recognize($image);

// Çıkarılan metni yazdır
echo $result->getText();

PHP ile Belirli Bir Dilde Metni Tanıma

OcrPHP kütüphanesi, PHP uygulamaları içinde OCR işlemlerini gerçekleştirmek için birden çok dili desteklemektedir. Metniniz İngilizce, Çince veya desteklenen diğer dillerden herhangi biri olsun, OcrPHP bunu sorunsuz bir şekilde işleyebilir. Belirli bir dilde metin çıkarmak için dil kodunu parametre olarak geçin. İlgili Tesseract dil modelinin kurulu olduğundan emin olun. Aşağıdaki örnek, geliştiricilerin PHP uygulamaları içinde Çince dilinde görüntülerden metin çıkarmasını göstermektedir.

PHP ile Çince Dilinde Bir Görüntüden Metin Nasıl Çıkarılır?

require 'vendor/autoload.php';

use Fizzday\Ocr\Ocr;

$imagePath = __DIR__ . '/example-image-chinese.png';

$ocr = new Ocr();

// Çince metin çıkar
$text = $ocr->scan($imagePath, 'chi_sim'); // İngilizce için 'eng' kullanın

echo "Çıkarılan Metin (Çince): \n" . $text;

PHP ile Toplu İşleme ve OCR Otomasyonu

Belge işleme uygulamaları geliştiren yazılım geliştiricileri için toplu işleme değerli bir özellik olabilir. Açık kaynak OcrPHP, geliştiricilerin bir dizindeki görüntü dosyaları üzerinde döngü yaparak her birinden otomatik olarak metin çıkarmasını kolaylaştırır. Bu, faturalar, makbuzlar veya kitaplar gibi tarama görevlerini otomatikleştirmek için mükemmeldir. Aşağıdaki çok faydalı örnek, belirtilen dizindeki tüm .png dosyalarını tarar, her birinden metin çıkarır ve ekrana yazdırır. Çıktıyı bir dosyaya veya veritabanına kaydetmek için genişletebilir, böylece belge işleme için güçlü bir araç elde edersiniz.

PHP Kütüphanesi ile Birden Çok Görüntüden Metin Nasıl Çıkarılır?

require 'vendor/autoload.php';

use Fizzday\Ocr\Ocr;

$directory = __DIR__ . '/images/';
$ocr = new Ocr();

foreach (glob($directory . '*.png') as $imagePath) {
    $text = $ocr->scan($imagePath);
    echo "Metin {$imagePath} dosyasından: \n" . $text . "\n\n";
}

Özel Yapılandırma ve Entegrasyon Desteği

Açık kaynak OcrPHP, PHP projelerine OCR yeteneklerini entegre etmeyi basitleştiren çok yönlü ve geliştirici dostu bir kütüphanedir. Kütüphane, dil, sayfa segmentasyon modu ve görüntü ön işleme parametreleri gibi özel Tesseract yapılandırmalarını belirlemenize olanak tanır; bu da OCR sonuçlarını özelleştirmenize esneklik sağlar.

 Türkçe