Aspose.OCR for Python via .NET

Text aus Bildern über Python-API lesen & extrahieren

Führende, leistungsstarke Python OCR API ermöglicht Entwicklern das Lesen und Extrahieren von Text aus Bildern, Fotos, Screenshots, gescannten Dokumenten und PDF-Dateien.

Im heutigen digitalen Zeitalter ist das Konvertieren von Bildern in editierbare Textformate zu einer wichtigen Aufgabe für viele Unternehmen und Entwickler geworden. Aspose.OCR for Python via .NET bietet eine robuste Lösung für Optical Character Recognition (OCR), die es Softwareentwicklern ermöglicht, Text mühelos aus Bildern zu extrahieren. Aspose.OCR for Python via .NET ist eine leistungsstarke Bibliothek für OCR‑Aufgaben. Sie ist Teil der Aspose‑Produktfamilie, die für hochwertige Dokumentenverarbeitungs‑Tools bekannt ist. Diese Bibliothek erlaubt Entwicklern, die Möglichkeiten des .NET‑Frameworks zu nutzen, während sie in Python programmieren, und so plattformübergreifende Anwendungen zu erstellen, die OCR‑Operationen nahtlos ausführen. Sie unterstützt die Erkennung von Text in über 100 Sprachen, darunter Englisch, Spanisch, Französisch, Deutsch, Italienisch, Chinesisch, Japanisch und viele weitere.

Aspose.OCR for Python via .NET ist eine .NET‑basierte OCR‑Bibliothek, die Entwicklern das Erkennen und Extrahieren von Text aus verschiedenen Bildformaten ermöglicht, darunter JPEG, PNG, GIF, BMP und TIFF. Die API verwendet fortschrittliche Algorithmen, um eine hohe Genauigkeit bei der Texterkennung aus unterschiedlichen Bildformaten sicherzustellen. Sie unterstützt die Erkennung von Text in verschiedenen Schriftarten und Stilen. Um die Erkennungsgenauigkeit zu erhöhen, bietet Aspose.OCR Vorverarbeitungsfunktionen wie Binarisierung, Entzerrung und Rauschunterdrückung. Dies hilft, Bilder für bessere OCR‑Ergebnisse vorzubereiten. Sie kann mehrere Bilder in einem einzigen Vorgang verarbeiten, was Batch‑Verarbeitung ermöglicht und Zeit spart, wenn große Bildmengen verarbeitet werden müssen. Mit ihren erweiterten Funktionen, einschließlich Mehrsprachenunterstützung, Bildvorverarbeitung, Layout‑Analyse und Fehlerbehandlung, ist Aspose.OCR die ideale Wahl für Softwareentwickler, die OCR‑basierte Projekte realisieren möchten.

Auf einen Blick

Eine Übersicht über die Funktionen von Aspose.OCR für Python via .NET.

Funktionsübersicht

OCR ausführen
OCR‑Funktionalität hinzufügen
Bildtext erkennen
Textbilder konvertieren
Erkannten Schrifttext
PDF durchsuchen
27 Erkennungssprachen
OCR‑Apps erstellen
Im Browser speichern
Text extrahieren
Mehr‑Thread‑Unterstützung

Funktionsübersicht

Gedrehte Bilder erkennen
Vorverarbeitungsfilter
PDF zu Bildern
Chinesische Zeichen erkennen
Beliebte Schriftarten erkennen
Ganzes Bild verarbeiten
Unterstützung für gedrehte Bilder
Batch‑Erkennung
Eingebauter Rechtschreibprüfer
PDF teilen
PDF zu Excel
PDF zu SVG

Aspose.OCR for Python via .NET

Die API unterstützt hauptsächlich das PDF‑Format, kann PDF‑Dokumente jedoch in eine Reihe anderer Formate exportieren.

Leser

PDF, PDF/A, TEX, XPS, SVG

Schreiber

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR for Python via .NET

Plattformunabhängigkeit

Aspose.OCR for Python via .NET kann mit jeder Python‑basierten Programmiersprache verwendet werden.

Python 3.6 und höher.

Aspose.OCR for Python via .NET

Erste Schritte mit Aspose.OCR for Python via .NET

Die empfohlene Methode, Aspose.OCR for Python via .NET zu installieren, ist die Verwendung von pip. Bitte führen Sie den folgenden Befehl für eine reibungslose Installation aus.

Installieren Sie Aspose.OCR for Python via .NET über pip

 pip install aspose-ocr-python-net

Sie können das SDK direkt von Aspose.OCR Python Cloud SDK Produktseite herunterladen

OCR‑Operationen mit hoher Genauigkeit via Python

Aspose.OCR for Python via .NET ist für hohe Präzision und Genauigkeit konzipiert. Die Bibliothek integriert fortschrittliche Machine‑Learning‑Modelle, die die Genauigkeit der Textextraktion selbst bei schiefen oder niedrig aufgelösten Bildern verbessern. Diese Funktion macht sie geeignet für Anwendungen, die zuverlässige Texterkennung benötigen, etwa automatisierte Datenerfassung aus gescannten Formularen oder Dokumenten. Das folgende Code‑Snippet zeigt eine einfache Implementierung, bei der ein Bild geladen, verarbeitet und der erkannte Text ausgegeben wird.

Wie lade ich Bilder, führe OCR aus und extrahiere Text über die Python‑API?

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Bildvorverarbeitungs‑Fähigkeiten

Aspose.OCR for Python via .NET bietet leistungsstarke Bildvorverarbeitungs‑Funktionen innerhalb von Python‑Anwendungen. Diese Funktionen verbessern die OCR‑Genauigkeit, etwa durch Entzerrung, Rauschunterdrückung und Bildnormalisierung. Solche Vorverarbeitungsschritte sind entscheidend, wenn mit Bildern gearbeitet wird, die unter suboptimalen Bedingungen gescannt wurden. Das folgende Beispiel demonstriert, wie Entwickler die Entzerrungs‑Operation ausführen, die sicherstellt, dass Text genau erkannt wird, selbst wenn das Bild leicht gekippt oder nicht perfekt ausgerichtet ist.

Wie führe ich eine OCR‑Operation mit Entzerrung innerhalb von Python‑Apps aus?

from aspose.ocr import OcrEngine, SkewCorrection

ocr_engine = OcrEngine()

# Enable skew correction
ocr_engine.set_skew_correction(SkewCorrection.True)

ocr_engine.image = "skewed_image.png"
recognized_text = ocr_engine.get_text()
print("Corrected and Recognized Text:", recognized_text)

Handschriftliche Texterkennung via Python

Aspose.OCR for Python via .NET ist sehr einfach zu handhaben und kann sowohl gedruckten als auch handschriftlichen Text mit nur wenigen Zeilen Python‑Code erkennen. Diese Funktion ist äußerst nützlich für Anwendungen wie das Digitalisieren handschriftlicher Notizen oder Unterschriften. Die Fähigkeit der Software, verschiedene Textstile zu interpretieren, erhöht ihren Nutzen in Bereichen wie Bildung und juristischer Dokumentation. Im Folgenden ein Beispiel, das zeigt, wie handschriftliche Texterkennung mit Python‑Code durchgeführt wird.

Wie führe ich handschriftliche Texterkennung über die Python‑Bibliothek aus?

api = ocr.AsposeOcr()

''' add filters if you need '''
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
#filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.contrast_correction_filter())

''' initialize image collection and put images into it '''
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
input.add("Data\\OCR\\handwritten.jpg")

''' change recognition options if you need '''
settings = ocr.RecognitionSettings()
settings.detect_areas_mode=ocr.DetectAreasMode.PHOTO

''' run recognition '''
res = api.recognize_handwritten_text(input)
print(res[0].recognition_text)

Benutzerdefinierte Bildregionen für OCR in Python‑Apps

Aspose.OCR for Python via .NET bietet vollständige Unterstützung für die Erkennung von Text aus einem bestimmten Bildbereich innerhalb von Python‑Anwendungen. Entwickler können bestimmte Regionen in einem Bild für OCR festlegen, was in Szenarien hilfreich ist, in denen nur ein Teil des Bildes relevanten Text enthält. Entwickler können benutzerdefinierte Regionen für OCR auf einem Bild definieren, Erkennungsmodi festlegen und weitere Parameter anpassen, um den OCR‑Prozess basierend auf den Anforderungen der Anwendung zu optimieren. Das folgende Beispiel zeigt, wie Entwickler mit nur wenigen Zeilen Python‑Code eine einzelne Textzeile erkennen können.

Wie erkenne ich eine einzelne Textzeile auf einem Bild über Python‑Apps?

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)