1. produkty
  2.   OCR
  3.   Python
  4.   Aspose.OCR for Python via .NET

Aspose.OCR for Python via .NET

 
 

Čtěte a extrahujte text z obrázků pomocí Python API

Vedoucí výkonné Python OCR API umožňuje vývojářům číst a extrahovat text z obrázků, fotografií, snímků obrazovky, naskenovaných dokumentů a PDF souborů.

V dnešní digitální éře se převod obrázků do editovatelných textových formátů stal nezbytným úkolem pro mnoho firem i vývojářů. Aspose.OCR pro Python via .NET poskytuje robustní řešení pro optické rozpoznávání znaků (OCR), které vývojářům softwaru umožňuje snadno extrahovat text z obrázků. Aspose.OCR pro Python via .NET je výkonná knihovna určená pro úlohy OCR. Je součástí sady produktů Aspose, která je proslulá poskytováním vysoce kvalitních nástrojů pro zpracování dokumentů. Tato knihovna umožňuje vývojářům využívat možnosti .NET frameworku při programování v Pythonu, čímž umožňuje multiplatformní aplikace, které mohou provádět OCR operace plynule. Podporuje rozpoznávání textu ve více než 100 jazycích, včetně angličtiny, španělštiny, francouzštiny, němčiny, italštiny, čínštiny, japonštiny a mnoha dalších.

Aspose.OCR pro Python via .NET je .NET‑based OCR knihovna, která umožňuje vývojářům rozpoznávat a extrahovat text z různých formátů obrázků, včetně JPEG, PNG, GIF, BMP a TIFF. API používá pokročilé algoritmy, aby zajistilo vysokou přesnost rozpoznávání textu z různých formátů obrázků. Podporuje rozpoznávání textu v různých písmech a stylech. Pro zvýšení přesnosti rozpoznávání nabízí Aspose.OCR předzpracovatelské možnosti, jako je binarizace, vyrovnání sklonu a odstraňování šumu. To pomáhá připravit obrázky pro lepší výsledky OCR. Dokáže zpracovat více obrázků v jednom procesu, což umožňuje dávkové zpracování a šetří čas v situacích, kdy je potřeba zpracovat velké objemy obrázků. Díky svým pokročilým funkcím, včetně podpory více jazyků, předzpracování obrázků, analýzy rozvržení a ošetření chyb, je Aspose.OCR ideální volbou pro vývojáře, kteří chtějí pracovat na projektech založených na OCR.

Previous Next

Začínáme s Aspose.OCR pro Python via .NET

Doporučený způsob instalace Aspose.OCR pro Python via .NET je pomocí pip. Použijte následující příkaz pro hladkou instalaci.

Instalace Aspose.OCR pro Python via .NET pomocí pip

 pip install aspose-ocr-python-net

SDK můžete stáhnout přímo ze stránky produktu Aspose.OCR Python Cloud SDK

Operace OCR s vysokou přesností pomocí Pythonu

Aspose.OCR pro Python via .NET je navrženo pro vysokou přesnost a spolehlivost. Knihovna obsahuje pokročilé modely strojového učení, které zlepšují přesnost extrakce textu, i u nakloněných nebo nízkokvalitních obrázků. Tato funkce je vhodná pro aplikace, které vyžadují spolehlivé rozpoznávání textu, například automatizované získávání dat ze skenovaných formulářů nebo dokumentů. Následující úryvek kódu ukazuje jednoduchou implementaci, kde je obrázek načten, zpracován a jeho rozpoznaný text zobrazen.

Jak načíst obrázky, provést OCR a extrahovat text pomocí Python API?

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Možnosti předzpracování obrázků

Knihovna Aspose.OCR pro Python via .NET poskytuje výkonné funkce předzpracování obrázků v Python aplikacích. Tyto funkce zvyšují přesnost OCR, například korekce sklonu, odstraňování šumu a normalizace obrázku. Tyto předzpracovatelské kroky jsou klíčové při práci s obrázky, které byly naskenovány za suboptimálních podmínek. Následující příklad ukazuje, jak vývojáři mohou provést operaci korekce sklonu, která zajišťuje, že text je přesně detekován, i když je obrázek mírně nakloněn nebo není dokonale zarovnán.

Jak provést operaci OCR s korekcí sklonu v Python aplikacích?

from aspose.ocr import OcrEngine, SkewCorrection

ocr_engine = OcrEngine()

# Enable skew correction
ocr_engine.set_skew_correction(SkewCorrection.True)

ocr_engine.image = "skewed_image.png"
recognized_text = ocr_engine.get_text()
print("Corrected and Recognized Text:", recognized_text)

Rozpoznávání rukopisu pomocí Pythonu

Aspose.OCR pro Python via .NET je velmi snadno použitelný a dokáže rozpoznávat jak tištěný, tak rukopisný text pouhými několika řádky Python kódu. Tato funkce je velmi užitečná pro aplikace jako digitalizace rukopisných poznámek nebo podpisů. Schopnost softwaru interpretovat různé styly textu zvyšuje jeho užitečnost v oblastech jako vzdělávání a právní dokumentace. Zde je příklad, který ukazuje, jak provést rozpoznávání rukopisu pomocí Python kódu.

Jak provést rozpoznávání rukopisu pomocí Python knihovny?

api = ocr.AsposeOcr()

''' add filters if you need '''
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
#filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.contrast_correction_filter())

''' initialize image collection and put images into it '''
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
input.add("Data\\OCR\\handwritten.jpg")

''' change recognition options if you need '''
settings = ocr.RecognitionSettings()
settings.detect_areas_mode=ocr.DetectAreasMode.PHOTO

''' run recognition '''
res = api.recognize_handwritten_text(input)
print(res[0].recognition_text)

Vlastní oblasti obrázku pro OCR v Python aplikacích

Aspose.OCR pro Python via .NET poskytuje kompletní podporu pro rozpoznávání textu z konkrétní oblasti obrázku v Python aplikacích. Vývojáři mohou specifikovat konkrétní oblasti v obrázku pro OCR, což je užitečné v situacích, kdy jen část obrázku obsahuje relevantní text. Vývojáři mohou definovat vlastní oblasti pro OCR na obrázku, nastavit režimy rozpoznávání a upravit další parametry pro optimalizaci OCR procesu podle specifických požadavků aplikace. Zde je příklad, který ukazuje, jak vývojáři mohou rozpoznat jediný řádek textu pomocí několika řádků Python kódu.

Jak rozpoznat jediný řádek textu na obrázku pomocí Python aplikací?

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)
 Čeština