PHP Kütüphanesi ile Görüntü Metnini Birden Çok Dilde Çıkar
Açık Kaynak PHP Optik Karakter Tanıma API'si, PHP uygulamaları içinde Görüntüleri veya Belgeleri Yükleyip Taramaya, Metni Tanımaya ve Birden Çok Dilde Çıkarmaya olanak tanır.
Optik Karakter Tanıma (OCR) teknolojisi, günümüzde görüntülerden ve belgelerden metin çıkarmak için vazgeçilmez bir araç haline gelmiştir. Dijital dönüşümün yükselişiyle, etkili ve doğru OCR çözümlerine olan ihtiyaç hiç bu kadar acil olmamıştı. OcrPHP, yazılım geliştiricilerin sağlam ve ölçeklenebilir OCR uygulamaları oluşturmasını sağlayan çok güçlü bir açık kaynak OCR kütüphanesidir. Google tarafından geliştirilen, yaygın olarak kullanılan ve yüksek itibara sahip OCR teknolojisi Tesseract OCR motorunu kullanan PHP tabanlı bir OCR kütüphanesidir. Kütüphane, belge tarama, görüntülerden metin çıkarma, belirli bir dilde metin çıkarma, PDF’lerden metin çıkarma ve daha birçok özelliği içerir.
OcrPHP kütüphanesi, OCR doğruluğunu artırmak için eğikliği düzeltme, lekeleri giderme ve ikilileştirme gibi gelişmiş görüntü ön işleme tekniklerini içermektedir. İngilizce, İspanyolca, Fransızca, Almanca, İtalyanca, Portekizce, Çince, Japonca ve daha birçok dili destekleyerek çoklu dilde OCR gerçekleştirebilir. Yazılım geliştiricileri, dili, sayfa segmentasyon modunu ve OCR motoru ayarlarını gibi parametreleri ayarlayarak OCR sürecini özelleştirebilir. Sağlam hata yönetimi mekanizmaları, OCR işlemlerinin sorunsuz ve verimli bir şekilde yürütülmesini sağlar. Çoklu dil desteği, gelişmiş görüntü tarama, özel yapılandırmalar ve basit entegrasyon gibi özelliklerle, geliştiricilerin az çaba ve düşük maliyetle çok yönlü metin tanıma araçları oluşturmasını mümkün kılar.
OcrPHP ile Başlarken
OcrPHP'yi kurmanın önerilen yolu Composer kullanmaktır. Sorunsuz bir kurulum için aşağıdaki komutu kullanın.
Composer ile OcrPHP Kurulumu
composer require fizzday/ocrphpGithub üzerinden OcrPHP Kurulumu
git clone https://github.com/fizzday/OcrPHP.git Derlenmiş paylaşımlı kütüphaneyi Github deposundan indirebilirsiniz.
PHP ile Bir Görüntüden Metni Tanıma ve Çıkarma
Açık kaynak OcrPHP kütüphanesi, yazılımların çeşitli görüntü tiplerini yüklemesini ve bu görüntülerden sadece birkaç PHP satırıyla metin çıkarmasını kolaylaştırır. Aşağıda Imagick kütüphanesini kullanarak bir görüntü dosyasını yükleyen ve OcrPHP sınıfının bir örneğini oluşturan çok basit bir örnek bulunmaktadır. Geliştiriciler, ardından dili ve OCR motoru ayarlarını belirleyebilir, recognize() yöntemiyle görüntü üzerinde OCR gerçekleştirebilir ve sonunda getText() yöntemiyle çıkarılan metni yazdırabilir.
PHP Kütüphanesi ile Bir Görüntüden Metin Nasıl Çıkarılır?
require_once 'OcrPHP/autoload.php';
// Görüntü dosyasını yükle
$image = new Imagick('path/to/image.jpg');
// OcrPHP sınıfının bir örneğini oluştur
$ocr = new OcrPHP();
// Dil ve OCR motoru ayarlarını belirle
$ocr->setLanguage('eng');
$ocr->setPageSegmentationMode(OcrPHP::PSM_SINGLE_BLOCK);
// Görüntü üzerinde OCR gerçekleştir
$result = $ocr->recognize($image);
// Çıkarılan metni yazdır
echo $result->getText();
PHP ile Belirli Bir Dilde Metni Tanıma
OcrPHP kütüphanesi, PHP uygulamaları içinde OCR işlemlerini gerçekleştirmek için birden çok dili desteklemektedir. Metniniz İngilizce, Çince veya desteklenen diğer dillerden herhangi biri olsun, OcrPHP bunu sorunsuz bir şekilde işleyebilir. Belirli bir dilde metin çıkarmak için dil kodunu parametre olarak geçin. İlgili Tesseract dil modelinin kurulu olduğundan emin olun. Aşağıdaki örnek, geliştiricilerin PHP uygulamaları içinde Çince dilinde görüntülerden metin çıkarmasını göstermektedir.
PHP ile Çince Dilinde Bir Görüntüden Metin Nasıl Çıkarılır?
require 'vendor/autoload.php';
use Fizzday\Ocr\Ocr;
$imagePath = __DIR__ . '/example-image-chinese.png';
$ocr = new Ocr();
// Çince metin çıkar
$text = $ocr->scan($imagePath, 'chi_sim'); // İngilizce için 'eng' kullanın
echo "Çıkarılan Metin (Çince): \n" . $text;
PHP ile Toplu İşleme ve OCR Otomasyonu
Belge işleme uygulamaları geliştiren yazılım geliştiricileri için toplu işleme değerli bir özellik olabilir. Açık kaynak OcrPHP, geliştiricilerin bir dizindeki görüntü dosyaları üzerinde döngü yaparak her birinden otomatik olarak metin çıkarmasını kolaylaştırır. Bu, faturalar, makbuzlar veya kitaplar gibi tarama görevlerini otomatikleştirmek için mükemmeldir. Aşağıdaki çok faydalı örnek, belirtilen dizindeki tüm .png dosyalarını tarar, her birinden metin çıkarır ve ekrana yazdırır. Çıktıyı bir dosyaya veya veritabanına kaydetmek için genişletebilir, böylece belge işleme için güçlü bir araç elde edersiniz.
PHP Kütüphanesi ile Birden Çok Görüntüden Metin Nasıl Çıkarılır?
require 'vendor/autoload.php';
use Fizzday\Ocr\Ocr;
$directory = __DIR__ . '/images/';
$ocr = new Ocr();
foreach (glob($directory . '*.png') as $imagePath) {
$text = $ocr->scan($imagePath);
echo "Metin {$imagePath} dosyasından: \n" . $text . "\n\n";
}
Özel Yapılandırma ve Entegrasyon Desteği
Açık kaynak OcrPHP, PHP projelerine OCR yeteneklerini entegre etmeyi basitleştiren çok yönlü ve geliştirici dostu bir kütüphanedir. Kütüphane, dil, sayfa segmentasyon modu ve görüntü ön işleme parametreleri gibi özel Tesseract yapılandırmalarını belirlemenize olanak tanır; bu da OCR sonuçlarını özelleştirmenize esneklik sağlar.