Aspose.OCR for Python via .NET

Baca & Ekstrak Teks dari Gambar via API Python

API OCR Python yang kuat memungkinkan Pengembang Membaca dan Mengekstrak Teks dari Gambar, Foto, Tangkapan Layar, Dokumen Pindai, dan File PDF.

Dalam era digital saat ini, mengonversi gambar menjadi format teks yang dapat diedit telah menjadi tugas penting bagi banyak bisnis dan pengembang. Aspose.OCR untuk Python via .NET menyediakan solusi andal untuk Pengakuan Karakter Optik (OCR) yang memungkinkan pengembang perangkat lunak mengekstrak teks dari gambar dengan mudah. Aspose.OCR untuk Python via .NET adalah perpustakaan kuat yang dirancang untuk tugas OCR. Ini merupakan bagian dari rangkaian produk Aspose, yang terkenal menyediakan alat pemrosesan dokumen berkualitas tinggi. Perpustakaan ini memungkinkan pengembang memanfaatkan kemampuan kerangka kerja .NET sambil menulis kode dalam Python, sehingga memungkinkan aplikasi lintas platform yang dapat melakukan operasi OCR secara mulus. Ia mendukung pengenalan teks dalam lebih dari 100 bahasa, termasuk Inggris, Spanyol, Prancis, Jerman, Italia, Cina, Jepang, dan banyak lagi.

Aspose.OCR untuk Python via .NET adalah perpustakaan OCR berbasis .NET yang memungkinkan pengembang mengenali dan mengekstrak teks dari berbagai format gambar, termasuk JPEG, PNG, GIF, BMP, dan TIFF. API ini menggunakan algoritma canggih untuk memastikan akurasi tinggi dalam pengenalan teks dari berbagai format gambar. Ia mendukung pengenalan teks dalam berbagai font dan gaya. Untuk meningkatkan akurasi pengenalan, Aspose.OCR menawarkan kemampuan pra‑pemrosesan seperti binarisasi, perbaikan kemiringan, dan penghilangan noise. Ini membantu menyiapkan gambar untuk hasil OCR yang lebih baik. Ia dapat menangani banyak gambar dalam satu proses, memungkinkan pemrosesan batch dan menghemat waktu dalam skenario di mana volume gambar yang besar perlu diproses. Dengan fitur canggihnya, termasuk dukungan multibahasa, pra‑pemrosesan gambar, analisis tata letak, dan penanganan kesalahan, Aspose.OCR adalah pilihan ideal bagi pengembang perangkat lunak yang ingin bekerja pada proyek berbasis OCR.

Sekilas

Gambaran umum fitur Aspose.OCR untuk Python via .NET.

Ikhtisar Fitur

Lakukan OCR
Tambahkan Kemampuan OCR
Mengenali teks gambar
Konversi gambar menjadi teks
Teks Font yang Diakui
Cari PDF
27 Bahasa Pengenalan
Buat aplikasi OCR
Simpan ke browser
Ekstrak Teks
Dukungan Multi‑threading

Ikhtisar Fitur

Mengenali Gambar yang Diputar
Filter pra‑pemrosesan
PDF ke Gambar
Mengenali Karakter Cina
Mendeteksi jenis huruf populer
Memproses seluruh gambar
Dukungan gambar diputar
Pengenalan batch
Pemeriksa ejaan bawaan
Pisah PDF
PDF ke Excel
PDF ke SVG

Aspose.OCR for Python via .NET

API terutama mendukung format PDF tetapi dapat mengekspor dokumen PDF ke sejumlah format lain.

Pembaca

PDF, PDF/A, TEX, XPS, SVG

Penulis

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR for Python via .NET

Kemandirian Platform

Aspose.OCR untuk Python via .NET dapat bekerja dengan bahasa pemrograman berbasis Python apa pun.

Python 3.6 ke atas.

Aspose.OCR untuk Python via .NET

Memulai dengan Aspose.OCR untuk Python via .NET

Metode yang direkomendasikan untuk menginstal Aspose.OCR untuk Python via .NET adalah menggunakan pip. Silakan gunakan perintah berikut untuk instalasi yang lancar.

Instal Aspose.OCR untuk Python via .NET via pip

 pip install aspose-ocr-python-net

Anda dapat mengunduh SDK langsung dari Aspose.OCR Python Cloud SDK halaman produk

Operasi OCR dengan Akurasi Tinggi via Python

Aspose.OCR untuk Python via .NET dirancang untuk presisi dan akurasi tinggi. Perpustakaan ini menggabungkan model pembelajaran mesin lanjutan yang meningkatkan akurasi ekstraksi teks, bahkan pada gambar yang miring atau beresolusi rendah. Fitur ini membuatnya cocok untuk aplikasi yang memerlukan pengenalan teks yang dapat diandalkan, seperti ekstraksi data otomatis dari formulir atau dokumen yang dipindai. Potongan kode berikut menampilkan implementasi sederhana dimana gambar dimuat, diproses, dan teks yang dikenali ditampilkan.

Bagaimana Cara Memuat Gambar, Melakukan OCR, dan Mengekstrak Teks via API Python?

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Kemampuan Pra‑Pemrosesan Gambar

Perpustakaan Aspose.OCR untuk Python via .NET menyediakan fitur pra‑pemrosesan gambar yang kuat di dalam aplikasi Python. Fitur‑fitur ini meningkatkan akurasi OCR, seperti koreksi kemiringan, penghilangan noise, dan normalisasi gambar. Langkah‑langkah pra‑pemrosesan ini penting ketika bekerja dengan gambar yang mungkin dipindai dalam kondisi kurang optimal. Contoh berikut menunjukkan bagaimana pengembang dapat melakukan operasi koreksi kemiringan yang memastikan teks terdeteksi secara akurat, bahkan jika gambar sedikit miring atau tidak sejajar sempurna.

Bagaimana Cara Melakukan Operasi OCR dengan Koreksi Kemiringan di dalam Aplikasi Python?

from aspose.ocr import OcrEngine, SkewCorrection

ocr_engine = OcrEngine()

# Enable skew correction
ocr_engine.set_skew_correction(SkewCorrection.True)

ocr_engine.image = "skewed_image.png"
recognized_text = ocr_engine.get_text()
print("Corrected and Recognized Text:", recognized_text)

Pengenalan Teks Tangan

Aspose.OCR untuk Python via .NET sangat mudah dipakai dan dapat mengenali baik teks cetak maupun tulisan tangan dengan hanya beberapa baris kode Python. Fitur ini sangat berguna bagi aplikasi seperti mendigitalisasi catatan tangan atau tanda tangan. Kemampuan perangkat lunak ini untuk menafsirkan berbagai gaya teks meningkatkan kegunaannya di sektor seperti pendidikan dan dokumentasi hukum. Berikut ini contoh yang menunjukkan cara melakukan Pengenalan Teks Tangan menggunakan kode Python.

Bagaimana Cara Melakukan Pengenalan Teks Tangan via Perpustakaan Python?

api = ocr.AsposeOcr()

''' add filters if you need '''
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
#filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.contrast_correction_filter())

''' initialize image collection and put images into it '''
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
input.add("Data\\OCR\\handwritten.jpg")

''' change recognition options if you need '''
settings = ocr.RecognitionSettings()
settings.detect_areas_mode=ocr.DetectAreasMode.PHOTO

''' run recognition '''
res = api.recognize_handwritten_text(input)
print(res[0].recognition_text)

Wilayah Gambar Kustom OCR di Aplikasi Python

Aspose.OCR untuk Python via .NET telah menyediakan dukungan lengkap untuk mengenali teks dari area tertentu pada gambar di dalam aplikasi Python. Pengembang perangkat lunak dapat menentukan wilayah khusus dalam gambar untuk OCR, yang berguna dalam skenario di mana hanya sebagian gambar yang berisi teks relevan.

Pengembang dapat mendefinisikan wilayah khusus untuk OCR pada gambar, menetapkan mode pengenalan, dan menyesuaikan parameter lain untuk mengoptimalkan proses OCR berdasarkan kebutuhan aplikasi spesifik. Berikut ini contoh yang menunjukkan cara pengembang perangkat lunak dapat mengenali satu baris teks dengan hanya dua baris kode Python.

Bagaimana Cara Mengenali Satu Baris Teks pada Gambar melalui Aplikasi Python?

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)