API Python Percuma untuk Mengintegrasikan Keupayaan OCR & Ekstrak Teks

Open Source Python OCR API untuk Pengecaman Teks yang Tepat dan Pantas daripada Imej & Dokumen. Baca kedua-dua Teks Pemandangan Asli dan Teks Padat dalam dokumen menggunakan Perpustakaan Python.

Teknologi Pengecaman Aksara Optik (OCR) telah wujud sejak sekian lama, dan ia digunakan dalam pelbagai industri untuk mengautomasikan tugasan kemasukan data dan pemprosesan dokumen. EasyOCR ialah enjin OCR (Optical Character Recognition) sumber terbuka yang pantas, tepat dan mudah digunakan. Ia menyediakan antara muka yang mudah digunakan untuk pembangun untuk menyepadukan OCR ke dalam aplikasi mereka. Dengan perpustakaan EasyOCR, pembangun perisian boleh mengekstrak teks daripada imej dan dokumen yang diimbas dalam masa beberapa saat, menjadikannya alat yang ideal untuk pengurusan dokumen, pengekstrakan data dan automasi.

EasyOCR ditulis dalam Python dan menyokong lebih 80+ bahasa, menjadikannya alat yang berkuasa untuk perniagaan yang beroperasi dalam persekitaran berbilang bahasa. Terdapat beberapa ciri penting bahagian perpustakaan seperti pengekstrakan teks yang tepat, sokongan berbilang bahasa, penyepaduan mudah dengan aplikasi sedia ada, menyesuaikan enjin OCR untuk memenuhi keperluan khusus anda, penyelesaian kos efektif, mengekstrak teks daripada dokumen yang diimbas, menerima & menyimpan teks yang diekstrak, dan banyak lagi. API ialah penyelesaian berasaskan awan yang tidak memerlukan sebarang pemasangan perkakasan atau perisian, menjadikannya penyelesaian yang kos efektif untuk perniagaan dari semua saiz.

API EasyOCR menggunakan algoritma pembelajaran mendalam untuk mencapai kadar ketepatan yang tinggi dan boleh memproses volum data yang besar dengan cepat. Ia ialah penyelesaian yang fleksibel dan berskala yang boleh disepadukan ke dalam aliran kerja sedia ada menggunakan API RESTful yang mudah. EasyOCR API ialah penyelesaian OCR berkuasa yang boleh membantu perniagaan dari semua saiz mengautomasikan proses kemasukan data mereka, meningkatkan ketepatan dan mengurangkan kos. Dengan sokongan untuk berbilang bahasa, ia merupakan alat yang ideal untuk pengurusan dokumen, pengekstrakan data dan automasi. Jika anda sedang mencari enjin OCR untuk disepadukan ke dalam aplikasi anda, cuba EasyOCR.

Sekilas Pandang

Ikhtisar ciri EasyOCR.

Gambaran Keseluruhan Ciri

Lakukan OCR
Tambah Keupayaan OCR
Kecam teks Imej
Imej convet teks
Teks Font Dikenali
Cari PDF
Bahasa Lain
Buat apl OCR
Simpan ke penyemak imbas
Ekstrak Teks
Sokongan Berbilang Benang

EasyOCR

EasyOCR menyokong format fail imej popular yang disenaraikan di bawah.

Pembaca

PNG, JPEG, BMP, TIFF, TGA, DICOM

Penulis

PNG, JPEG, BMP, TIFF

EasyOCR

Kemerdekaan Platform

EasyOCR boleh berfungsi dengan Python 2.7 dan ke atas.

Python 2.7 & ke atas.

EasyOCR

Bermula dengan EasyOCR

Cara yang disyorkan untuk memasang EasyOCR adalah menggunakan pip. Sila gunakan arahan berikut untuk pemasangan yang lancar.

Pasang EasyOCR melalui pip

 pip install easyocr

Anda juga boleh memasangnya secara manual; muat turun fail keluaran terkini terus daripada repositori GitHub.

Bacaan Teks & Pengekstrakan daripada Imej melalui API Python

API EasyOCR sumber terbuka menggunakan algoritma pembelajaran mendalam untuk memuatkan, mengecam dan mengekstrak teks daripada imej dan fail PDF dalam aplikasi Python. EasyOCR boleh membaca berbilang bahasa pada masa yang sama tetapi mereka perlu serasi antara satu sama lain. Bahasa yang berkongsi kebanyakan aksara (cth. skrip latin) antara satu sama lain adalah serasi. API membenarkan membaca dan mengekstrak teks daripada imej, termasuk cara pra-memproses imej dan melaraskan parameter enjin OCR untuk meningkatkan ketepatan. Contoh berikut menunjukkan cara membaca dan mengekstrak teks daripada imej dan mengautomasikan tugasan kemasukan data dengan mudah.

Baca dan Ekstrak Teks daripada Imej melalui API Python

import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine

# Load the image and preprocess it

from PIL import Image
import cv2

image = Image.open('text_image.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_image.png')

# Use the OCR engine to extract text from the image.

result = reader.readtext(image, detail=0)

Mengenal Watak daripada Kotak Teks melalui API Python

Mengecam aksara daripada kotak teks ialah kes penggunaan biasa untuk enjin OCR. API EasyOCR sumber terbuka menyediakan penyelesaian yang berkuasa dan mesra pengguna untuk kes penggunaan ini. Ia membantu pembangun perisian untuk mengenali aksara daripada kotak teks dengan mudah dan cara mempraproses imej dan melaraskan parameter enjin OCR untuk meningkatkan ketepatan. Kotak teks boleh mempunyai bentuk, saiz dan orientasi yang berbeza, dan ini boleh memberi kesan kepada ketepatan enjin OCR. Jadi menggunakan beberapa langkah prapemprosesan boleh meningkatkan ketepatan enjin OCR, seperti Deskew the image, Guna binarisasi dan Guna pengurangan hingar.

Bagaimana Mengenal Watak daripada Kotak Teks melalui API Python?

import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine

# Load the image and preprocess it

from PIL import Image
import cv2

image = Image.open('text_box.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_box.png')

# OCR engine to recognize the characters in the text box

result = reader.readtext(image, detail=0)

# The result is a list of strings, where each string represents a recognized character in the text box.