Resim PDF'lerini Aranabilir Hale Getirmek için Açık Kaynak Python OCR API'si

OCR Sürecini Otomatikleştiren ve Taranan Görüntü PDF'lerinin kolaylıkla tamamen Aranabilir Belgelere Dönüştürülmesini Kolaylaştıran Güçlü Ücretsiz Python OCR API'si.

Optik Karakter Tanıma (OCR) teknolojisi, belgeleri işleme ve işleme şeklimizde devrim yaratarak değerli bilgileri verimli bir şekilde çıkarmamızı sağladı. Mevcut birçok OCR aracı arasında OCRmyPDF, kullanım kolaylığını olağanüstü doğrulukla birleştiren çok yönlü ve güçlü bir Python kütüphanesi olarak öne çıkıyor. OCRmyPDF, mevcut PDF dosyalarına OCR eklemek için özel olarak tasarlanmış açık kaynaklı bir komut satırı aracı ve Python kitaplığıdır. Kitaplık, bir PDF dosyasının her sayfasını analiz ederek o sayfadaki tüm bilgilerin içeriği kaybetmeden yakalanması için gereken renk alanını ve çözünürlüğü (DPI) belirler.

Açık kaynak OCRmyPDF kitaplığı, taranmış görüntüler, mevcut PDF'ler ve hatta DjVu dosyaları da dahil olmak üzere çok çeşitli giriş formatlarını destekler. "Resim artı metin" ilkesiyle çalışır ve orijinal belgenin yapısını ve formatını koruyarak yüksek kaliteli çıktı üretmeyi amaçlar. Kitaplık, mümkün olan en yüksek kaliteyi korurken dosya boyutunu küçültmek için PDF optimizasyon tekniklerini kullanır. Sıkıştırma ve alt örnekleme uygulayarak, ortaya çıkan OCR özellikli PDF dosyalarının hem verimli şekilde saklanmasını hem de hızlı yüklenmesini sağlar.

OCRmyPDF, 100'den fazla dili destekleyen güçlü Tesseract OCR motorunu kullanır. Gelişmiş algoritmaları, düşük kaliteli veya bozuk görüntülerden bile metnin doğru şekilde tanınmasını sağlar. Kütüphane, normal bir PDF'den kolaylıkla aranabilir bir PDF/A dosyası oluşturmak için destek sağlamıştır. Ayrıca, dosyaların görünümünü ve OCR'nin kalitesini iyileştiren eğrilik giderme gibi bazı görüntü işleme seçenekleri de sağlar. Bunlar kullanıldığında, bunun yerine OCR katmanı işlenmiş görüntünün üzerine aşılanır. Birden fazla dil desteği, PDF optimizasyonu, metin katmanı kontrolü ve otomatik işlemeyi içeren kapsamlı özellik seti, onu işletmeler, araştırmacılar, arşivciler ve büyük hacimli taranmış belgelerle uğraşan herkes için değerli bir araç haline getirir.

Bir Bakışta

OCRmyPDF özelliklerine genel bakış.

Özelliklere genel bakış

OCR gerçekleştirin
OCR Yetenekleri Ekleme
Resim metnini tanıma
Metnin resimlerini dönüştürün
Tanınan Yazı Tipi metni
PDF'de ara
Diğer Diller
OCR uygulamaları oluşturma
Tarayıcıya kaydet
Metni Çıkart
Çoklu İş Parçacığı Desteği

OCRmyPDF

OCRmyPDF, aşağıda listelenen popüler resim dosyası biçimlerini destekler.

Okuyucu

PNG, JPEG, BMP, TIFF, TGA, DICOM

yazar

PNG, JPEG, BMP, TIFF

OCRmyPDF

Platform Bağımsızlığı

OCRmyPDF, Python 2.7 ve üzeri sürümlerle çalışabilir.

Python 2.7 ve üzeri.

OCRmyPDF

OCRmyPDF'ye Başlarken

OCRmyPDF'i kurmanın önerilen yolu pip kullanmaktır. Sorunsuz bir kurulum için lütfen aşağıdaki komutu kullanın.

OCRmyPDF'yi pip aracılığıyla yükleyin

 pip install ocrmypdf

Ayrıca manuel olarak da kurabilirsiniz; En son sürüm dosyalarını doğrudan GitHub deposundan

indirin.

Python API'sini kullanarak PDF optimizasyonu

Açık kaynak OCRmyPDF kitaplığı, Python uygulamaları içindeki PDF belgelerinin boyutunu ve kalitesini yönetmek için çok kullanışlı özellikler sağlamıştır. Kitaplık, mümkün olan en yüksek kaliteyi korurken dosya boyutunu küçültmek için PDF optimizasyon tekniklerini kullanır. Sıkıştırma ve alt örnekleme uygulayarak, elde edilen OCR özellikli PDF dosyalarının hem verimli bir şekilde saklanmasını hem de hızlı bir şekilde yüklenmesini sağlar. OCRmyPDF, gereksinimlerinize göre özelleştirebileceğiniz çeşitli optimizasyon seçenekleri sunar. Yaygın olarak kullanılan bazı seçenekler arasında geçici dosyaların kaldırılması, JBIG2 sıkıştırmasının uygulanması, OCR eklemenin atlanması, dosya boyutunun küçültülmesini en üst düzeye çıkarmak için kayıpsız sıkıştırmanın devre dışı bırakılması vb. yer alır.

Python API Kullanılarak PDF Dosyaları Nasıl Optimize Edilir?

import subprocess

def optimize_pdf_with_ocrmypdf(input_pdf_path, output_pdf_path):
    try:
        # OCRmyPDF command with optimization options
        command = ['ocrmypdf', '-l', 'eng', '--pdf-renderer', 'hocr', '--optimize', '0', input_pdf_path, output_pdf_path]
        
        # Execute the OCRmyPDF command
        subprocess.run(command, check=True)
        
        print("PDF optimization complete!")
    except subprocess.CalledProcessError as e:
        print(f"OCRmyPDF error: {e}")
        
# Example usage
input_pdf_path = 'input.pdf'
output_pdf_path = 'output.pdf'

optimize_pdf_with_ocrmypdf(input_pdf_path, output_pdf_path)

Python API aracılığıyla PDF Metin Katmanı Entegrasyonu

Açık kaynaklı bir kitaplık olan OCRmyPDF, metin katmanlarını PDF dosyalarına entegre etmek, belge erişilebilirliğini ve arama yeteneğini geliştirmek için güçlü bir çözüm sunar. Kitaplık, OCR tarafından oluşturulan metni içeren bir metin katmanını doğrudan PDF belgesine ekleyerek orijinal düzenin korunmasını sağlar. Bu özellik tam metin aramayı, kopyalayıp yapıştırmayı ve metin çıkarmayı mümkün kılar. PDF belgeleriyle çalışırken dosyaya entegre bir metin katmanına sahip olmak oldukça avantajlıdır. Metin katmanı, tanınan OCR tarafından oluşturulan metni içerir, bu da PDF'yi aranabilir hale getirir ve metnin kolay kopyalanmasına ve çıkarılmasına olanak tanır. Bu entegrasyon, metin tabanlı işlemlere olanak tanırken orijinal belge düzenini korur ve belgenin kullanılabilirliğini ve verimliliğini artırır.