Aspose.OCR for Python via .NET

Odczyt i wyodrębnianie tekstu z obrazów za pomocą API Pythona

Wiodące, potężne API OCR dla Pythona umożliwia programistom odczytywanie i wyodrębnianie tekstu z obrazów, zdjęć, zrzutów ekranu, zeskanowanych dokumentów i plików PDF.

W dzisiejszej erze cyfrowej konwertowanie obrazów na edytowalne formaty tekstowe stało się kluczowym zadaniem dla wielu firm i programistów. Aspose.OCR for Python via .NET zapewnia solidne rozwiązanie dla rozpoznawania znaków optycznych (OCR), które umożliwia programistom oprogramowania łatwe wyodrębnianie tekstu z obrazów. Aspose.OCR for Python via .NET jest potężną biblioteką przeznaczoną do zadań OCR. Jest częścią rodziny produktów Aspose, znanej z wysokiej jakości narzędzi do przetwarzania dokumentów. Biblioteka ta pozwala programistom wykorzystać możliwości platformy .NET przy programowaniu w Pythonie, co umożliwia tworzenie aplikacji wieloplatformowych wykonujących operacje OCR bezproblemowo. Obsługuje rozpoznawanie tekstu w ponad 100 językach, w tym angielskim, hiszpańskim, francuskim, niemieckim, włoskim, chińskim, japońskim i wielu innych.

Aspose.OCR for Python via .NET jest biblioteką OCR opartą na .NET, która pozwala programistom rozpoznawać i wyodrębniać tekst z różnych formatów obrazów, w tym JPEG, PNG, GIF, BMP i TIFF. API wykorzystuje zaawansowane algorytmy, aby zapewnić wysoką dokładność rozpoznawania tekstu z różnych formatów obrazów. Obsługuje rozpoznawanie tekstu w różnych czcionkach i stylach. Aby zwiększyć dokładność rozpoznawania, Aspose.OCR oferuje możliwości przetwarzania wstępnego, takie jak binaryzacja, prostowanie i usuwanie szumów. Pomaga to w przygotowaniu obrazów do lepszych wyników OCR. Biblioteka może obsługiwać wiele obrazów w jednym procesie, umożliwiając przetwarzanie wsadowe i oszczędzając czas w sytuacjach, gdy trzeba przetworzyć dużą liczbę obrazów. Dzięki zaawansowanym funkcjom, takim jak obsługa wielu języków, przetwarzanie wstępne obrazów, analiza układu i obsługa błędów, Aspose.OCR jest idealnym wyborem dla programistów chcących pracować nad projektami opartymi na OCR.

Na pierwszy rzut oka

Przegląd funkcji Aspose.OCR for Python via .NET.

Features Overview

Wykonywanie OCR
Dodawanie możliwości OCR
Rozpoznawanie tekstu na obrazie
Konwertowanie obrazów tekstowych
Rozpoznany tekst czcionki
Przeszukiwanie PDF
27 języków rozpoznawania
Tworzenie aplikacji OCR
Zapis do przeglądarki
Wyodrębnianie tekstu
Obsługa wielowątkowości

Features Overview

Rozpoznawanie obróconego obrazu
Filtry przetwarzania wstępnego
PDF na obrazy
Rozpoznaje chińskie znaki
Wykrywa popularne czcionki
Przetwarza cały obraz
Obsługa obróconych obrazów
Rozpoznawanie wsadowe
Wbudowany korektor ortograficzny
Podział PDF
PDF na Excel
PDF na SVG

Aspose.OCR for Python via .NET

API głównie obsługuje format PDF, ale może eksportować dokumenty PDF do wielu innych formatów.

Reader

PDF, PDF/A, TEX, XPS, SVG

Writer

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR for Python via .NET

Niezależność platformowa

Aspose.OCR for Python via .NET może współpracować z dowolnym językiem programowania opartym na Pythonie.

Python 3.6 i nowsze.

Aspose.OCR for Python via .NET

Rozpoczęcie pracy z Aspose.OCR for Python via .NET

Zalecany sposób instalacji Aspose.OCR for Python via .NET to użycie pip. Proszę użyć poniższego polecenia, aby przeprowadzić płynną instalację.

Install Aspose.OCR for Python via .NET via pip

 pip install aspose-ocr-python-net

Możesz pobrać SDK bezpośrednio ze strony produktu Aspose.OCR Python Cloud SDK product page

Operacje OCR z wysoką dokładnością w Pythonie

Aspose.OCR for Python via .NET jest zaprojektowany pod kątem wysokiej precyzji i dokładności. Biblioteka wykorzystuje zaawansowane modele uczenia maszynowego, które poprawiają dokładność wyodrębniania tekstu, nawet przy skośnych lub niskiej rozdzielczości obrazach. Funkcja ta sprawia, że jest ona odpowiednia dla aplikacji wymagających niezawodnego rozpoznawania tekstu, takich jak automatyczne wyodrębnianie danych ze zeskanowanych formularzy lub dokumentów. Poniższy fragment kodu prezentuje prostą implementację, w której obraz jest wczytywany, przetwarzany i wyświetlany jest rozpoznany tekst.

Jak wczytać obrazy, wykonać OCR i wyodrębnić tekst za pomocą API Pythona?

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Możliwości przetwarzania wstępnego obrazów

Aspose.OCR for Python via .NET library provides powerful image preprocessing features inside Python applications. The features enhance OCR accuracy, such as skew correction, noise removal, and image normalization. These preprocessing steps are crucial when working with images that may have been scanned under suboptimal conditions. The following example demonstrates how developers can perform the skew correction operation which ensures that text is accurately detected, even if the image is slightly tilted or not perfectly aligned.

Jak wykonać operację OCR z korekcją pochylenia w aplikacjach Python?

from aspose.ocr import OcrEngine, SkewCorrection

ocr_engine = OcrEngine()

# Enable skew correction
ocr_engine.set_skew_correction(SkewCorrection.True)

ocr_engine.image = "skewed_image.png"
recognized_text = ocr_engine.get_text()
print("Corrected and Recognized Text:", recognized_text)

Rozpoznawanie odręcznego tekstu w Pythonie

Aspose.OCR for Python via .NET is very easy to handle and can recognize both printed and handwritten text with just a couple of lines of Python code. This features is very useful for applications like digitizing handwritten notes or signatures. The software’s ability to interpret various styles of text enhances its utility in sectors like education and legal documentation. Here is an example that shows how to perform Handwritten Text Recognition using Python code.

Jak wykonać rozpoznawanie odręcznego tekstu przy użyciu biblioteki Python?

api = ocr.AsposeOcr()

''' add filters if you need '''
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
#filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.contrast_correction_filter())

''' initialize image collection and put images into it '''
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
input.add("Data\\OCR\\handwritten.jpg")

''' change recognition options if you need '''
settings = ocr.RecognitionSettings()
settings.detect_areas_mode=ocr.DetectAreasMode.PHOTO

''' run recognition '''
res = api.recognize_handwritten_text(input)
print(res[0].recognition_text)

Niestandardowe regiony obrazu OCR w aplikacjach Python

Aspose.OCR for Python via .NET has provided complete support for recognizing text from a particular area of an image inside Python applications. Software developers can specify specific regions within an image for OCR, which is helpful in scenarios where only a portion of the image contains relevant text. Developers can define custom regions for OCR on an image, set recognition modes, and adjust other parameters to optimize the OCR process based on specific application requirements. Here is an example that shows how software developers can recognize a single line of text with just a couple of lines of Python code.

Jak rozpoznać pojedynczą linię tekstu na obrazie w aplikacjach Python?

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)