Aspose.OCR for Python via .NET

Lire et Extraire le Texte des Images via l'API Python

L'API OCR Python puissante et de premier plan permet aux développeurs de lire et d'extraire le texte des images, photos, captures d'écran, documents numérisés et fichiers PDF.

À l'ère numérique actuelle, convertir des images en formats de texte éditables est devenu une tâche essentielle pour de nombreuses entreprises et développeurs. Aspose.OCR for Python via .NET fournit une solution robuste pour la Reconnaissance Optique de Caractères (OCR) qui permet aux développeurs de logiciels d'extraire du texte des images sans effort. Aspose.OCR for Python via .NET est une bibliothèque puissante conçue pour les tâches OCR. Elle fait partie de la suite de produits Aspose, reconnue pour fournir des outils de traitement de documents de haute qualité. Cette bibliothèque permet aux développeurs de tirer parti des capacités du framework .NET tout en codant en Python, permettant ainsi des applications multiplateformes capables d'effectuer des opérations OCR de manière fluide. Elle prend en charge la reconnaissance du texte dans plus de 100 langues, dont l'anglais, l'espagnol, le français, l'allemand, l'italien, le chinois, le japonais et bien d'autres.

Aspose.OCR for Python via .NET est une bibliothèque OCR basée sur .NET qui permet aux développeurs de reconnaître et d'extraire du texte à partir de divers formats d'image, y compris JPEG, PNG, GIF, BMP et TIFF. L'API utilise des algorithmes avancés pour garantir une haute précision dans la reconnaissance du texte à partir de différents formats d'image. Elle prend en charge la reconnaissance du texte dans différentes polices et styles. Pour améliorer la précision de la reconnaissance, Aspose.OCR propose des capacités de prétraitement telles que la binarisation, le redressement et la suppression du bruit. Cela aide à préparer les images pour de meilleurs résultats OCR. Elle peut gérer plusieurs images en un seul processus, permettant le traitement par lots et économisant du temps dans les scénarios où de grands volumes d'images doivent être traités. Avec ses fonctionnalités avancées, incluant la prise en charge multilingue, le prétraitement d'images, l'analyse de mise en page et la gestion des erreurs, Aspose.OCR est un choix idéal pour les développeurs logiciels souhaitant travailler sur des projets basés sur l'OCR.

En un coup d'œil

Un aperçu des fonctionnalités d'Aspose.OCR for Python via .NET.

Features Overview

Effectuer l'OCR
Ajouter des capacités OCR
Reconnaître le texte d'image
Convertir les images de texte
Texte de police reconnu
Rechercher dans le PDF
27 langues de reconnaissance
Créer des applications OCR
Enregistrer dans le navigateur
Extraire le texte
Prise en charge du multithreading

Features Overview

Reconnaître les images tournées
Filtres de prétraitement
PDF en images
Reconnaît les caractères chinois
Détecte les polices populaires
Traite l'image entière
Prise en charge des images tournées
Reconnaissance par lots
Correcteur orthographique intégré
Diviser le PDF
PDF en Excel
PDF en SVG

Aspose.OCR for Python via .NET

L'API prend principalement en charge le format PDF mais peut exporter les documents PDF vers plusieurs autres formats.

Lecteur

PDF, PDF/A, TEX, XPS, SVG

Écrivain

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR for Python via .NET

Indépendance de la plateforme

Aspose.OCR for Python via .NET peut fonctionner avec n'importe quel langage de programmation basé sur Python.

Python 3.6 et supérieur.

Aspose.OCR for Python via .NET

Commencer avec Aspose.OCR for Python via .NET

La méthode recommandée pour installer Aspose.OCR for Python via .NET est d'utiliser pip. Veuillez utiliser la commande suivante pour une installation fluide.

Install Aspose.OCR for Python via .NET via pip

 pip install aspose-ocr-python-net

Vous pouvez télécharger le SDK directement depuis la page produit Aspose.OCR Python Cloud SDK

Opérations OCR avec haute précision via Python

Aspose.OCR for Python via .NET est conçu pour une haute précision et exactitude. La bibliothèque intègre des modèles d'apprentissage automatique avancés qui améliorent la précision de l'extraction de texte, même avec des images inclinées ou de faible résolution. Cette fonctionnalité la rend adaptée aux applications nécessitant une reconnaissance fiable du texte, comme l'extraction automatisée de données à partir de formulaires ou documents numérisés. Le fragment de code suivant montre une implémentation simple où une image est chargée, traitée, et son texte reconnu est affiché.

Comment charger des images, effectuer l'OCR et extraire le texte via l'API Python ?

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Capacités de prétraitement d'image

La bibliothèque Aspose.OCR for Python via .NET offre de puissantes fonctionnalités de prétraitement d'image dans les applications Python. Ces fonctionnalités améliorent la précision de l'OCR, telles que la correction de l'inclinaison, la suppression du bruit et la normalisation de l'image. Ces étapes de prétraitement sont cruciales lorsqu'on travaille avec des images qui ont pu être numérisées dans des conditions sous-optimales. L'exemple suivant montre comment les développeurs peuvent effectuer l'opération de correction d'inclinaison qui garantit que le texte est détecté avec précision, même si l'image est légèrement inclinée ou mal alignée.

Comment effectuer une opération OCR avec correction d'inclinaison dans les applications Python ?

from aspose.ocr import OcrEngine, SkewCorrection

ocr_engine = OcrEngine()

# Enable skew correction
ocr_engine.set_skew_correction(SkewCorrection.True)

ocr_engine.image = "skewed_image.png"
recognized_text = ocr_engine.get_text()
print("Corrected and Recognized Text:", recognized_text)

Reconnaissance de texte manuscrit via Python

Aspose.OCR for Python via .NET est très facile à manipuler et peut reconnaître à la fois le texte imprimé et manuscrit avec seulement quelques lignes de code Python. Cette fonctionnalité est très utile pour des applications telles que la numérisation de notes manuscrites ou de signatures. La capacité du logiciel à interpréter différents styles de texte renforce son utilité dans des secteurs comme l'éducation et la documentation juridique. Voici un exemple montrant comment effectuer la reconnaissance de texte manuscrit en utilisant du code Python.

Comment effectuer la reconnaissance de texte manuscrit via la bibliothèque Python ?

api = ocr.AsposeOcr()

''' add filters if you need '''
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
#filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.contrast_correction_filter())

''' initialize image collection and put images into it '''
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
input.add("Data\\OCR\\handwritten.jpg")

''' change recognition options if you need '''
settings = ocr.RecognitionSettings()
settings.detect_areas_mode=ocr.DetectAreasMode.PHOTO

''' run recognition '''
res = api.recognize_handwritten_text(input)
print(res[0].recognition_text)

Régions d'image personnalisées OCR dans les applications Python

Aspose.OCR for Python via .NET offre un support complet pour la reconnaissance de texte à partir d'une zone particulière d'une image dans les applications Python. Les développeurs peuvent spécifier des régions précises au sein d'une image pour l'OCR, ce qui est utile dans les scénarios où seule une partie de l'image contient du texte pertinent. Les développeurs peuvent définir des régions personnalisées pour l'OCR sur une image, définir les modes de reconnaissance et ajuster d'autres paramètres afin d'optimiser le processus OCR selon les exigences spécifiques de l'application. Voici un exemple montrant comment les développeurs peuvent reconnaître une ligne de texte unique avec seulement quelques lignes de code Python.

Comment reconnaître une ligne de texte unique sur une image via les applications Python ?

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)

Aspose.OCR for Python via .NET

Lire et Extraire le Texte des Images via l'API Python

L'API OCR Python puissante et de premier plan permet aux développeurs de lire et d'extraire le texte des images, photos, captures d'écran, documents numérisés et fichiers PDF.

En un coup d'œil

Indépendance de la plateforme

Commencer avec Aspose.OCR for Python via .NET

Install Aspose.OCR for Python via .NET via pip

Opérations OCR avec haute précision via Python

Comment charger des images, effectuer l'OCR et extraire le texte via l'API Python ?

Capacités de prétraitement d'image

Comment effectuer une opération OCR avec correction d'inclinaison dans les applications Python ?

Reconnaissance de texte manuscrit via Python

Comment effectuer la reconnaissance de texte manuscrit via la bibliothèque Python ?

Régions d'image personnalisées OCR dans les applications Python

Comment reconnaître une ligne de texte unique sur une image via les applications Python ?

Comment charger des images, effectuer l'OCR et extraire le texte via l'API Python ?

Comment effectuer une opération OCR avec correction d'inclinaison dans les applications Python ?

Comment effectuer la reconnaissance de texte manuscrit via la bibliothèque Python ?

Comment reconnaître une ligne de texte unique sur une image via les applications Python ?