1. Termékek
  2.   OCR
  3.   Python
  4.   OCRmyPDF
 
  

Nyílt forráskódú Python OCR API a kép-PDF-ek kereshetővé tételéhez

Egy hatékony ingyenes Python OCR API automatizálja az OCR folyamatot, és megkönnyíti a beszkennelt PDF-képek teljes körűen kereshető dokumentumokká történő konvertálását.

Az optikai karakterfelismerő (OCR) technológia forradalmasította a dokumentumok kezelését és feldolgozását, lehetővé téve számunkra az értékes információk hatékony kinyerését. A számos elérhető OCR-eszköz közül az OCRmyPDF sokoldalú és hatékony Python-könyvtárként tűnik ki, amely a könnyű használhatóságot kivételes pontossággal ötvözi. Az OCRmyPDF egy nyílt forráskódú parancssori eszköz és Python-könyvtár, amelyet kifejezetten arra terveztek, hogy OCR-t adjon a meglévő PDF-fájlokhoz. A könyvtár elemzi a PDF-fájl minden oldalát, hogy meghatározza a színteret és a felbontást (DPI), amely az oldalon található összes információ rögzítéséhez tartalomvesztés nélkül szükséges.

A nyílt forráskódú OCRmyPDF könyvtár a beviteli formátumok széles skáláját támogatja, beleértve a szkennelt képeket, a meglévő PDF-eket és még a DjVu-fájlokat is. A „kép plusz szöveg” elvén működik, és az eredeti dokumentum szerkezetének és formázásának megőrzésével kiváló minőségű kimenetet kíván előállítani. A könyvtár PDF optimalizálási technikákat alkalmaz a fájlméret csökkentése érdekében, miközben a lehető legjobb minőséget fenntartja. A tömörítés és a lefelé mintavételezés alkalmazásával biztosítja, hogy az eredményül kapott OCR-kompatibilis PDF-fájlok hatékonyan tárolhatók és gyorsan betölthetők legyenek.

Az OCRmyPDF a robusztus Tesseract OCR motort használja, amely több mint 100 nyelvet támogat. Fejlett algoritmusai biztosítják a szöveg pontos felismerését, még gyenge minőségű vagy torz képekről is. A könyvtár támogatást nyújtott a kereshető PDF/A fájl egyszerű PDF-ből történő létrehozásához. Néhány képfeldolgozási lehetőséget is biztosít, például a ferdítést, amely javítja a fájlok megjelenését és az OCR minőségét. Ezek használatakor az OCR-réteget a rendszer a feldolgozott képre oltja be. Átfogó szolgáltatáskészlete, beleértve a több nyelv támogatását, a PDF-optimalizálást, a szövegréteg-vezérlést és az automatizált feldolgozást, értékes eszközzé teszi a vállalkozások, kutatók, levéltárosok és bárki számára, aki nagy mennyiségű szkennelt dokumentummal foglalkozik.

Previous Next

Kezdő lépések az OCRmyPDF használatával

Az OCRmyPDF telepítésének javasolt módja a pip használata. Kérjük, használja a következő parancsot a zökkenőmentes telepítés érdekében.

Telepítse az OCRmyPDF fájlt pip segítségével

 pip install ocrmypdf 

Kézzel is telepítheti; töltse le a legújabb kiadású fájlokat közvetlenül a GitHub tárhelyről.

PDF optimalizálás Python API használatával

A nyílt forráskódú OCRmyPDF-könyvtár egy nagyon hasznos szolgáltatást nyújtott a Python-alkalmazásokon belüli PDF-dokumentumok méretének és minőségének kezeléséhez. A könyvtár PDF optimalizálási technikákat alkalmaz a fájlméret csökkentése érdekében, miközben a lehető legjobb minőséget fenntartja. A tömörítés és a lefelé mintavételezés alkalmazásával biztosítja, hogy az eredményül kapott OCR-kompatibilis PDF-fájlok hatékonyan tárolhatók és gyorsan betölthetők legyenek. Az OCRmyPDF számos optimalizálási lehetőséget kínál, amelyeket igényei szerint testre szabhat. Néhány gyakran használt lehetőség az ideiglenes fájlok eltávolítása, a JBIG2 tömörítés alkalmazása, az OCR hozzáadásának kihagyása, a veszteségmentes tömörítés letiltása a fájlméret maximalizálása érdekében és így tovább.

Hogyan lehet optimalizálni a PDF fájlokat Python API használatával?

import subprocess

def optimize_pdf_with_ocrmypdf(input_pdf_path, output_pdf_path):
    try:
        # OCRmyPDF command with optimization options
        command = ['ocrmypdf', '-l', 'eng', '--pdf-renderer', 'hocr', '--optimize', '0', input_pdf_path, output_pdf_path]
        
        # Execute the OCRmyPDF command
        subprocess.run(command, check=True)
        
        print("PDF optimization complete!")
    except subprocess.CalledProcessError as e:
        print(f"OCRmyPDF error: {e}")
        
# Example usage
input_pdf_path = 'input.pdf'
output_pdf_path = 'output.pdf'

optimize_pdf_with_ocrmypdf(input_pdf_path, output_pdf_path)

PDF szövegréteg integráció Python API-n keresztül

Az OCRmyPDF, egy nyílt forráskódú könyvtár, hatékony megoldást kínál a szöveges rétegek PDF-fájlokba való integrálására, javítva a dokumentumok hozzáférhetőségét és a keresési képességet. A könyvtár egy OCR által generált szöveget tartalmazó szövegréteget ad közvetlenül a PDF dokumentumhoz, ezzel biztosítva az eredeti elrendezés megőrzését. Ez a funkció lehetővé teszi a teljes szöveges keresést, másolás-beillesztést és szövegkivonást. A PDF-dokumentumokkal végzett munka során rendkívül előnyös a fájlba integrált szövegréteg. A szövegréteg tartalmazza a felismert OCR által generált szöveget, amely kereshetővé teszi a PDF-fájlt, és lehetővé teszi a szöveg könnyű másolását és kinyerését. Ez az integráció megőrzi a dokumentum eredeti elrendezését, miközben lehetővé teszi a szöveges műveleteket, javítva a dokumentumok használhatóságát és hatékonyságát.

 Magyar