Aspose.OCR for Python via .NET

Baca & Ekstrak Teks dari Imej melalui API Python

API OCR Python yang kuat terkemuka membolehkan Pembangun Membaca dan Mengekstrak Teks dari Imej, Foto, Tangkapan Skrin, Dokumen Diimbas, dan Fail PDF.

In era digital masa kini, menukar imej kepada format teks yang boleh disunting telah menjadi tugas penting bagi banyak perniagaan dan pembangun. Aspose.OCR for Python via .NET menyediakan penyelesaian mantap untuk Pengenalan Aksara Optik (OCR) yang membolehkan pembangun perisian mengekstrak teks dari imej dengan mudah. Aspose.OCR untuk Python via .NET adalah perpustakaan yang kuat direka untuk tugas OCR. Ia merupakan sebahagian daripada suite produk Aspose, yang terkenal kerana menyediakan alat pemprosesan dokumen berkualiti tinggi. Perpustakaan ini membolehkan pembangun memanfaatkan keupayaan rangka kerja .NET sambil menulis kod dalam Python, sekaligus membolehkan aplikasi merentas platform yang dapat melaksanakan operasi OCR dengan lancar. Ia menyokong pengenalan teks dalam lebih daripada 100 bahasa, termasuk Bahasa Inggeris, Sepanyol, Perancis, Jerman, Itali, Cina, Jepun, dan banyak lagi.

Aspose.OCR untuk Python via .NET adalah perpustakaan OCR berasaskan .NET yang membolehkan pembangun mengenali dan mengekstrak teks dari pelbagai format imej, termasuk JPEG, PNG, GIF, BMP, dan TIFF. API ini menggunakan algoritma canggih untuk memastikan ketepatan tinggi dalam pengenalan teks dari pelbagai format imej. Ia menyokong pengenalan teks dalam pelbagai fon dan gaya. Untuk meningkatkan ketepatan pengenalan, Aspose.OCR menawarkan keupayaan pra-pemprosesan seperti binarisasi, pembetulan kecenderungan (deskewing), dan penyingkiran hingar. Ini membantu menyediakan imej untuk hasil OCR yang lebih baik. Ia dapat mengendalikan berbilang imej dalam satu proses, membolehkan pemprosesan kelompok dan menjimatkan masa dalam senario di mana sejumlah besar imej perlu diproses. Dengan ciri-ciri canggihnya, termasuk sokongan berbilang bahasa, pra-pemprosesan imej, analisis susun atur, dan pengendalian ralat, Aspose.OCR adalah pilihan ideal bagi pembangun perisian yang ingin bekerja pada projek berasaskan OCR.

Gambaran Keseluruhan

Gambaran keseluruhan ciri-ciri Aspose.OCR untuk Python via .NET.

Features Overview

Lakukan OCR
Tambah Keupayaan OCR
Kenali teks Imej
Tukar imej teks
Teks Fon yang dikenali
Cari PDF
27 Bahasa Pengenalan
Buat aplikasi OCR
Simpan ke pelayar
Ekstrak Teks
Sokongan Multi-threading

Features Overview

Kenali Imej berputar
Penapis pra-pemprosesan
PDF ke Imej
Mengenali Aksara Cina
Mengesan jenis fon popular
Memproses keseluruhan imej
Sokongan imej berputar
Pengenalan kumpulan
Pemeriksa ejaan terbina dalam
Pisahkan PDF
PDF ke Excel
PDF ke SVG

Aspose.OCR untuk Python via .NET

API utama menyokong format PDF tetapi boleh mengeksport dokumen PDF ke beberapa format lain.

Pembaca

PDF, PDF/A, TEX, XPS, SVG

Penulis

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR untuk Python via .NET

Kebebasan Platform

Aspose.OCR untuk Python via .NET boleh berfungsi dengan mana-mana bahasa pengaturcaraan berasaskan Python.

Python 3.6 ke atas.

Aspose.OCR untuk Python via .NET

Memulakan dengan Aspose.OCR untuk Python via .NET

Cara yang disarankan untuk memasang Aspose.OCR untuk Python via .NET ialah menggunakan pip. Sila gunakan perintah berikut untuk pemasangan yang lancar.

Install Aspose.OCR for Python via .NET via pip

 pip install aspose-ocr-python-net

Anda boleh memuat turun SDK secara langsung dari Aspose.OCR Python Cloud SDK product page

Operasi OCR dengan Ketepatan Tinggi melalui Python

Aspose.OCR untuk Python via .NET direka untuk ketepatan dan kebolehpercayaan tinggi. Perpustakaan ini menggabungkan model pembelajaran mesin canggih yang meningkatkan ketepatan pengekstrakan teks, walaupun pada imej yang condong atau beresolusi rendah. Ciri ini menjadikannya sesuai untuk aplikasi yang memerlukan pengenalan teks yang boleh dipercayai, seperti pengekstrakan data automatik daripada borang atau dokumen yang diimbas. Potongan kod berikut memaparkan pelaksanaan mudah di mana imej dimuatkan, diproses, dan teks yang dikenali dipaparkan.

Bagaimana Memuatkan Imej, Melakukan OCR dan Mengekstrak Teks melalui API Python?

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Keupayaan Pra-pemprosesan Imej

Aspose.OCR untuk Python via .NET menyediakan ciri pra-pemprosesan imej yang kuat dalam aplikasi Python. Ciri-ciri ini meningkatkan ketepatan OCR, seperti pembetulan kecenderungan, penyingkiran hingar, dan penormalan imej. Langkah-langkah pra-pemprosesan ini penting apabila bekerja dengan imej yang mungkin diimbas dalam keadaan tidak optimum. Contoh berikut menunjukkan bagaimana pembangun dapat melaksanakan operasi pembetulan kecenderungan yang memastikan teks dikesan dengan tepat, walaupun imej sedikit condong atau tidak sejajar sempurna.

Bagaimana Melaksanakan Operasi OCR dengan Pembetulan Kecenderungan dalam Aplikasi Python?

from aspose.ocr import OcrEngine, SkewCorrection

ocr_engine = OcrEngine()

# Enable skew correction
ocr_engine.set_skew_correction(SkewCorrection.True)

ocr_engine.image = "skewed_image.png"
recognized_text = ocr_engine.get_text()
print("Corrected and Recognized Text:", recognized_text)

Pengenalan Teks Tangan melalui Python

Aspose.OCR untuk Python via .NET sangat mudah digunakan dan boleh mengenali teks cetak serta tulisan tangan dengan hanya beberapa baris kod Python. Ciri ini sangat berguna untuk aplikasi seperti mendigitalkan nota atau tandatangan tulisan tangan. Keupayaan perisian untuk mentafsir pelbagai gaya teks meningkatkan kegunaannya dalam sektor seperti pendidikan dan dokumentasi undang-undang. Berikut ialah contoh yang menunjukkan cara melakukan Pengenalan Teks Tangan menggunakan kod Python.

Bagaimana Melakukan Pengenalan Teks Tangan melalui Perpustakaan Python?

api = ocr.AsposeOcr()

''' add filters if you need '''
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
#filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.contrast_correction_filter())

''' initialize image collection and put images into it '''
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
input.add("Data\\OCR\\handwritten.jpg")

''' change recognition options if you need '''
settings = ocr.RecognitionSettings()
settings.detect_areas_mode=ocr.DetectAreasMode.PHOTO

''' run recognition '''
res = api.recognize_handwritten_text(input)
print(res[0].recognition_text)

Kawasan Imej Tersuai OCR dalam Aplikasi Python

Aspose.OCR untuk Python via .NET telah menyediakan sokongan lengkap untuk mengenali teks dari kawasan tertentu dalam imej di dalam aplikasi Python. Pembangun perisian boleh menentukan kawasan khusus dalam imej untuk OCR, yang berguna dalam senario di mana hanya sebahagian imej mengandungi teks yang relevan. Pembangun boleh menetapkan kawasan tersuai untuk OCR pada imej, menetapkan mod pengenalan, dan menyesuaikan parameter lain untuk mengoptimumkan proses OCR berdasarkan keperluan aplikasi tertentu. Berikut ialah contoh yang menunjukkan bagaimana pembangun perisian dapat mengenali satu baris teks dengan hanya beberapa baris kod Python.

Bagaimana Mengenali Satu Baris Teks pada Imej melalui Aplikasi Python?

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)