Şəkil PDF-lərini Axtarıla bilən etmək üçün Açıq Mənbə Python OCR API

OCR prosesini avtomatlaşdıran və skan edilmiş Şəkil PDF-lərinin asanlıqla tam axtarış edilə bilən sənədlərə çevrilməsini asanlaşdıran güclü pulsuz Python OCR API.

Optik Character Recognition (OCR) texnologiyası bizim sənədlərlə işləmə və emal üsulumuzda inqilab etdi və bizə dəyərli məlumatları səmərəli şəkildə çıxarmağa imkan verdi. Mövcud olan bir çox OCR alətləri arasında OCRmyPDF istifadə asanlığını müstəsna dəqiqliklə birləşdirən çox yönlü və güclü Python kitabxanası kimi seçilir. OCRmyPDF, mövcud PDF fayllarına OCR əlavə etmək üçün xüsusi olaraq hazırlanmış açıq mənbəli əmr xətti aləti və Python kitabxanasıdır. Kitabxana PDF faylının hər bir səhifəsini təhlil edərək məzmunu itirmədən həmin səhifədəki bütün məlumatları ələ keçirmək üçün lazım olan rəng məkanını və ayırdetmə qabiliyyətini (DPI) müəyyən edir.

Açıq mənbəli OCRmyPDF kitabxanası skan edilmiş şəkillər, mövcud PDF-lər və hətta DjVu faylları daxil olmaqla geniş çeşidli daxiletmə formatlarını dəstəkləyir. O, "şəkil üstəgəl mətn" prinsipi əsasında fəaliyyət göstərir və orijinal sənədin strukturunu və formatını qorumaqla yüksək keyfiyyətli məhsul istehsal etməyi hədəfləyir. Kitabxana, mümkün olan ən yüksək keyfiyyəti qoruyarkən fayl ölçüsünü azaltmaq üçün PDF optimallaşdırma üsullarından istifadə edir. Sıxılma və aşağı seçmə tətbiq etməklə, nəticədə OCR-i aktivləşdirən PDF fayllarının həm səmərəli saxlanmasını, həm də tez yüklənməsini təmin edir.

OCRmyPDF 100-dən çox dili dəstəkləyən güclü Tesseract OCR mühərrikindən istifadə edir. Onun inkişaf etmiş alqoritmləri hətta aşağı keyfiyyətli və ya təhrif olunmuş şəkillərdən belə mətnin dəqiq tanınmasını təmin edir. Kitabxana asanlıqla adi PDF-dən axtarış edilə bilən PDF/A faylı yaratmaq üçün dəstək göstərmişdir. O, həmçinin faylların görünüşünü və OCR keyfiyyətini yaxşılaşdıran əyrilik kimi bəzi təsvirin işləmə variantlarını təqdim edir. Bunlardan istifadə edildikdə, OCR təbəqəsi yerinə işlənmiş təsvirin üzərinə aşılanır. Onun çoxsaylı dillərə dəstək, PDF optimallaşdırılması, mətn qatına nəzarət və avtomatlaşdırılmış emal daxil olmaqla hərtərəfli funksiyalar dəsti onu bizneslər, tədqiqatçılar, arxivçilər və böyük həcmdə skan edilmiş sənədlərlə məşğul olan hər kəs üçün dəyərli alətə çevirir.

Bir Baxışda

OCRmyPDF funksiyalarına ümumi baxış.

Xüsusiyyətlərə Baxış

OCR həyata keçirin
OCR Bacarıqları əlavə edin
Şəkil mətnini tanıyın
Mətnin konvet şəkilləri
Tanınan Şrift mətni
PDF-də axtarın
Digər Dillər
OCR proqramları yaradın
Brauzerdə yadda saxla
Mətni çıxarın
Multi-Treading Dəstəyi

OCRmyPDF

OCRmyPDF aşağıda sadalanan məşhur şəkil faylı formatlarını dəstəkləyir.

Oxucu

PNG, JPEG, BMP, TIFF, TGA, DICOM

yazıçı

PNG, JPEG, BMP, TIFF

OCRmyPDF

Platformanın Müstəqilliyi

OCRmyPDF Python 2.7 və daha yuxarı versiyalarla işləyə bilər.

Python 2.7 və yuxarı.

OCRmyPDF

OCRmyPDF ilə işə başlamaq

OCRmyPDF quraşdırmanın tövsiyə olunan yolu pipdən istifadə etməkdir. Düzgün quraşdırma üçün aşağıdakı əmrdən istifadə edin.

OCRmyPDF-ni pip vasitəsilə quraşdırın

 pip install ocrmypdf

Siz onu əl ilə də quraşdıra bilərsiniz; ən son buraxılış fayllarını birbaşa GitHub deposundan endirin.

Python API istifadə edərək PDF optimallaşdırılması

Açıq mənbəli OCRmyPDF kitabxanası Python proqramları daxilində PDF sənədlərinin ölçüsünü və keyfiyyətini idarə etmək üçün çox faydalı funksiyaları dəstəkləmişdir. Kitabxana, mümkün olan ən yüksək keyfiyyəti qoruyarkən fayl ölçüsünü azaltmaq üçün PDF optimallaşdırma üsullarından istifadə edir. Sıxılma və aşağı seçmə tətbiq etməklə, nəticədə OCR-i aktivləşdirən PDF fayllarının həm saxlanması üçün səmərəli, həm də tez yüklənməsini təmin edir. OCRmyPDF, tələblərinizə əsasən fərdiləşdirə biləcəyiniz bir neçə optimallaşdırma variantını təqdim edir. Tez-tez istifadə olunan bəzi seçimlərə müvəqqəti faylları silmək, JBIG2 sıxılma tətbiq etmək, OCR əlavə etməyi atlamaq, fayl ölçüsünü azaltmaq üçün itkisiz sıxılmanı söndürmək və s. daxildir.

Python API istifadə edərək PDF fayllarını necə optimallaşdırmaq olar?

import subprocess

def optimize_pdf_with_ocrmypdf(input_pdf_path, output_pdf_path):
    try:
        # OCRmyPDF command with optimization options
        command = ['ocrmypdf', '-l', 'eng', '--pdf-renderer', 'hocr', '--optimize', '0', input_pdf_path, output_pdf_path]
        
        # Execute the OCRmyPDF command
        subprocess.run(command, check=True)
        
        print("PDF optimization complete!")
    except subprocess.CalledProcessError as e:
        print(f"OCRmyPDF error: {e}")
        
# Example usage
input_pdf_path = 'input.pdf'
output_pdf_path = 'output.pdf'

optimize_pdf_with_ocrmypdf(input_pdf_path, output_pdf_path)

Python API vasitəsilə PDF Mətn Qatının İnteqrasiyası

OCRmyPDF, açıq mənbəli kitabxana, mətn qatlarını PDF fayllarına inteqrasiya etmək, sənədlərin əlçatanlığını və axtarış qabiliyyətini artırmaq üçün güclü həll yolu təqdim edir. Kitabxana orijinal tərtibatın qorunmasını təmin edərək birbaşa PDF sənədinə OCR tərəfindən yaradılmış mətndən ibarət mətn qatını əlavə edir. Bu funksiya tam mətni axtarmağa, kopyala-yapışdırmağa və mətn çıxarmağa imkan verir. PDF sənədləri ilə işləyərkən, faylın içərisinə inteqrasiya olunmuş mətn qatının olması çox sərfəlidir. Mətn qatı tanınmış OCR tərəfindən yaradılan mətni ehtiva edir, bu da PDF-i axtarmağa imkan verir və mətnin asanlıqla surətini çıxarmağa və çıxarmağa imkan verir. Bu inteqrasiya mətn əsaslı əməliyyatları aktivləşdirməklə, sənədin istifadə imkanlarını və səmərəliliyini artırmaqla bərabər orijinal sənəd tərtibatını qoruyur.