Aspose.OCR for Python via .NET

Citește și Extrage Text din Imagini prin API Python

API-ul Python OCR puternic permite Dezvoltatorilor să Citească și să Extraga Text din Imagini, Fotografi, Capturi de Ecran, Documente Scanate și Fișiere PDF.

În era digitală de astăzi, convertirea imaginilor în formate de text editabile a devenit o sarcină vitală pentru multe afaceri și dezvoltatori. Aspose.OCR pentru Python prin .NET oferă o soluție robustă pentru Recunoașterea Optică a Caracterelor (OCR) care permite dezvoltatorilor să extragă text din imagini fără efort. Aspose.OCR pentru Python prin .NET este o bibliotecă puternică concepută pentru sarcini OCR. Face parte din suita de produse Aspose, renumită pentru furnizarea de instrumente de procesare a documentelor de înaltă calitate. Această bibliotecă permite dezvoltatorilor să valorifice capabilitățile platformei .NET în timp ce programează în Python, permițând astfel aplicații cross‑platform care pot efectua operații OCR fără probleme. Suportă recunoașterea textului în peste 100 de limbi, inclusiv engleză, spaniolă, franceză, germană, italiană, chineză, japoneză și multe altele.

Aspose.OCR pentru Python prin .NET este o bibliotecă OCR bazată pe .NET care permite dezvoltatorilor să recunoască și să extragă text din diverse formate de imagini, inclusiv JPEG, PNG, GIF, BMP și TIFF. API‑ul folosește algoritmi avansați pentru a asigura o acuratețe înaltă în recunoașterea textului din diferite formate de imagini. Suportă recunoașterea textului în diferite fonturi și stiluri. Pentru a spori acuratețea recunoașterii, Aspose.OCR oferă capabilități de preprocesare precum binarizare, corecție a înclinării și eliminare a zgomotului. Acest lucru ajută la pregătirea imaginilor pentru rezultate OCR mai bune. Poate gestiona mai multe imagini într-un singur proces, permițând procesarea în lot și economisind timp în scenarii în care trebuie procesate volume mari de imagini. Cu funcționalitățile sale avansate, inclusiv suport multilingv, preprocesare a imaginilor, analiză de layout și gestionarea erorilor, Aspose.OCR este o alegere ideală pentru dezvoltatorii de software care doresc să lucreze la proiecte bazate pe OCR.

Prezentare Generală

O privire de ansamblu asupra funcționalităților Aspose.OCR pentru Python prin .NET.

Prezentare Funcționalități

Efectuează OCR
Adaugă Funcționalitate OCR
Recunoaște text din imagine
Convertește imagini de text
Recunoaște text din fonturi
Caută în PDF
27 de Limbi de Recunoaștere
Creează aplicații OCR
Salvează în browser
Extrage Text
Suport Multi‑threading

Prezentare Funcționalități

Recunoaște imagine rotită
Filtre de preprocesare
PDF în Imagini
Recunoaște caractere chinezești
Detectează tipografii populare
Procesează întreaga imagine
Suport pentru imagini rotite
Recunoaștere în lot
Corector ortografic integrat
Împarte PDF
PDF în Excel
PDF în SVG

Aspose.OCR pentru Python prin .NET

API‑ul suportă în principal formatul PDF, dar poate exporta documente PDF în numeroase alte formate.

Cititor

PDF, PDF/A, TEX, XPS, SVG

Scriitor

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR pentru Python prin .NET

Independență Platformă

Aspose.OCR pentru Python prin .NET poate lucra cu orice limbaj de programare bazat pe Python.

Python 3.6 și versiuni superioare.

Aspose.OCR pentru Python prin .NET

Începerea lucrului cu Aspose.OCR pentru Python prin .NET

Modul recomandat pentru instalarea Aspose.OCR pentru Python prin .NET este utilizarea pip. Vă rugăm să folosiți comanda de mai jos pentru o instalare fără probleme.

Instalează Aspose.OCR pentru Python prin .NET cu pip

 pip install aspose-ocr-python-net

Puteți descărca SDK‑ul direct de pe pagina de produs Aspose.OCR Python Cloud SDK

Operații OCR cu Precizie Ridicată în Python

Aspose.OCR pentru Python prin .NET este proiectat pentru precizie și acuratețe înaltă. Biblioteca încorporează modele avansate de învățare automată care îmbunătățesc acuratețea extracției de text, chiar și în imagini înclinate sau cu rezoluție scăzută. Această funcționalitate îl face potrivit pentru aplicații care necesită recunoaștere de text fiabilă, cum ar fi extragerea automată de date din formulare sau documente scanate. Fragmentul de cod de mai jos prezintă o implementare simplă în care o imagine este încărcată, procesată și textul recunoscut este afișat.

Cum să încarci imagini, să efectuezi OCR și să extragi text prin API Python?

# Inițializează motorul OCR
recognitionEngine = AsposeOcr()

# Adaugă imagine în lot
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extrage text din imagine
result = recognitionEngine.recognize(input)
# Afișează rezultatul recunoașterii
print(result[0].recognition_text)

Capacități de Preprocesare a Imaginilor

Biblioteca Aspose.OCR pentru Python prin .NET oferă funcții puternice de preprocesare a imaginilor în cadrul aplicațiilor Python. Aceste funcții îmbunătățesc acuratețea OCR, cum ar fi corecția înclinării, eliminarea zgomotului și normalizarea imaginii. Acești pași de preprocesare sunt esențiali atunci când se lucrează cu imagini care pot fi scanate în condiții suboptimale. Exemplul de mai jos demonstrează cum dezvoltatorii pot efectua operația de corecție a înclinării, asigurându-se că textul este detectat corect, chiar dacă imaginea este ușor înclinată sau nu este perfect aliniată.

Cum să efectuezi o operație OCR cu corecție a înclinării în aplicații Python?

from aspose.ocr import OcrEngine, SkewCorrection

ocr_engine = OcrEngine()

# Activează corecția înclinării
ocr_engine.set_skew_correction(SkewCorrection.True)

ocr_engine.image = "skewed_image.png"
recognized_text = ocr_engine.get_text()
print("Text Corectat și Recunoscut:", recognized_text)

Recunoaștere de Text Scris de Mână în Python

Aspose.OCR pentru Python prin .NET este foarte ușor de utilizat și poate recunoaște atât text tipărit, cât și text scris de mână cu doar câteva linii de cod Python. Această funcționalitate este foarte utilă pentru aplicații precum digitizarea notițelor scrise de mână sau a semnăturilor. Capacitatea software‑ului de a interpreta diverse stiluri de text îi sporește utilitatea în sectoare precum educația și documentația juridică. Mai jos este un exemplu care arată cum să efectuezi Recunoașterea Textului Scris de Mână folosind cod Python.

Cum să efectuezi Recunoașterea Textului Scris de Mână prin Biblioteca Python?

api = ocr.AsposeOcr()

''' adaugă filtre dacă este nevoie '''
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
#filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.contrast_correction_filter())

''' inițializează colecția de imagini și adaugă imagini '''
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
input.add("Data\\OCR\\handwritten.jpg")

''' modifică opțiunile de recunoaștere dacă este nevoie '''
settings = ocr.RecognitionSettings()
settings.detect_areas_mode=ocr.DetectAreasMode.PHOTO

''' rulează recunoașterea '''
res = api.recognize_handwritten_text(input)
print(res[0].recognition_text)

Regiuni Personalizate ale Imaginilor OCR în Aplicații Python

Aspose.OCR pentru Python prin .NET oferă suport complet pentru recunoașterea textului dintr-o anumită zonă a unei imagini în cadrul aplicațiilor Python. Dezvoltatorii pot specifica regiuni specifice dintr-o imagine pentru OCR, ceea ce este util în scenarii în care doar o parte a imaginii conține text relevant. Dezvoltatorii pot defini regiuni personalizate pentru OCR pe o imagine, pot seta moduri de recunoaștere și pot ajusta alți parametri pentru a optimiza procesul OCR în funcție de cerințele specifice ale aplicației. Mai jos este un exemplu care arată cum dezvoltatorii pot recunoaște o singură linie de text cu doar câteva linii de cod Python.

Cum să recunoști o singură linie de text pe o imagine în aplicații Python?

api = AsposeOcr()

# Crează OcrInput și adaugă imagini
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recunoaște fără detectarea regiunilor
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)