1. Məhsullar
  2.   OCR
  3.   Python
  4.   PaddleOCR
 
  

OCR imkanlarını inteqrasiya etmək üçün açıq mənbə Python API

Proqram tərtibatçılarına optik xarakter tanıma (OCR) imkanlarını tətbiqlərinə asanlıqla inteqrasiya etməyə imkan verən Açıq Mənbəli Python kitabxanası.

PaddleOCR proqram tərtibatçılarına optik xarakter tanıma (OCR) imkanlarını öz Python proqramlarına asanlıqla inteqrasiya etməyə imkan verən güclü açıq mənbəli Python kitabxanasıdır. O, açıq mənbəli dərin öyrənmə platforması olan PaddlePaddle üzərində qurulub və yüksək dəqiqlik və performansa nail olmaq üçün ən müasir dərin öyrənmə modellərindən istifadə edir. PaddleOCR, bir çox aşağı səviyyəli təfərrüatları mücərrədləşdirən yüksək səviyyəli API təmin etməklə OCR prosesini sadələşdirir və tərtibatçıların tətbiqlərinə OCR imkanlarını əlavə etməyi asanlaşdırır.

PaddleOCR geniş çeşidli dillər və skriptlər üçün tam dəstək göstərmişdir. Hal-hazırda o, ərəb, çin, ingilis, fransız, alman, yapon, Koreya, rus, ispan və bir çox başqa dillər daxil olmaqla 80-dən çox müxtəlif dilləri dəstəkləyir. Bu, onu çoxdilli məzmunla işləməli olan tərtibatçılar üçün dəyərli bir vasitə halına gətirir. Güclü OCR imkanlarına əlavə olaraq, kitabxanaya şəkillər və mətnlə işləmək üçün bir sıra faydalı proqramlar da daxildir. Məsələn, o, təsvirin ilkin işlənməsi üçün alətlər, məsələn, əyriliyin aradan qaldırılması və binarizasiya, eləcə də OCR çıxışının dəqiqliyini artırmaq üçün sonrakı emal alətləri daxildir.

PaddleOCR hər biri müxtəlif istifadə halları üçün optimallaşdırılmış bir neçə fərqli OCR modelini təqdim edir. Məsələn, mətnin aşkarlanması modeli təsvirdən mətn bölgələrini tapmaq və çıxarmaq üçün, Mətnin tanınması modeli isə həmin bölgələrdəki faktiki mətni tanımaq üçün istifadə olunur. Tərtibatçılara daha yüksək dəqiqliyə nail olmaq üçün bir neçə modeli birləşdirməyə imkan verən Model Ansamblı funksiyası da var. Ümumiyyətlə, PaddleOCR, Python proqramlarınıza OCR imkanları əlavə etmək üçün güclü və istifadəsi asan kitabxanadır. Onun geniş çeşidli dillər və skriptlər üçün dəstəyi, həmçinin fərdiləşdirilə bilən modelləri və sonrakı emal alətləri onu OCR ilə işləyən tərtibatçılar üçün dəyərli alətə çevirir.

Previous Next

PaddleOCR ilə işə başlama

PaddleOCR quraşdırmanın tövsiyə olunan yolu pipdən istifadə etməkdir. Rahat quraşdırma üçün aşağıdakı əmrdən istifadə edin

PaddleOCR-ni pip vasitəsilə quraşdırın

 

PaddleOCR-ni pip vasitəsilə quraşdırın

 pip install paddleocr 

Siz onu əl ilə də quraşdıra bilərsiniz; ən son buraxılış fayllarını birbaşa GitHub deposundan endirin.

PaddleOCR API vasitəsilə Şəkil mətninin tanınması

Şəkil mətninin tanınması şəkillərdən mətnin çıxarılması prosesidir. Bu, sənədlərin skan edilməsi, rəqəmsallaşdırma və OCR (Optik xarakter tanınması) kimi müxtəlif tətbiqlər üçün faydalı bir texnikadır. Açıq mənbəli OCR (Optik Character Recognition) API skan edilmiş sənədlər, skrinşotlar və fotoşəkillər də daxil olmaqla müxtəlif şəkillərdən mətni tanıya bilən ən müasir OCR modelləri dəsti təqdim edir. Kitabxana şəkillərin yüklənməsi, OCR modelinin işə salınması, şəkildəki mətn bölgəsinin müəyyən edilməsi, Şəkildən mətnin tanınması, nəticədən mətnin çıxarılması və sair kimi təsvirin mətninin tanınması ilə bağlı bir sıra vacib funksiyaları dəstəkləyir. Aşağıdakı nümunə Python proqramları daxilində təsvirdən mətnin necə tanınacağını göstərir.

Python Layihələrində Şəkil Mətni Tanınmasını həyata keçirin

import paddleocr
ocr = paddleocr.OCR()

# load an image using the PIL
from PIL import Image

image = Image.open('example.jpg')
result = ocr.ocr(image)

# access the recognized text

for line in result:
    print(line[1][0])
    print(line[1][1])

Python API istifadə edərək OCR Sənədin Tanınması

Sənədin tanınması OCR üçün əsas tədqiqat sahələrindən biri olmuşdur. Sənədlər həyatımızda demək olar ki, hər gün istifadə olunur. Proqram tərtibatçıları sənədə OCR tətbiq etdikdə, o, vacib məlumatları əldə edə, forma sahələrini əldə edə, tərtibatı təhlil edə, rəqəmsal olaraq saxlaya, həmçinin köhnə əlyazmaları oxuya bilər. Açıq mənbəli PaddleOCR kitabxanası proqram tərtibatçılarına müxtəlif növ sənədləri yükləməyə, OCR əməliyyatlarını yerinə yetirməyə və Python kodundan istifadə edərək mətni tanıyıb çıxarmağa imkan verir. Mətnin tanınması çox dəqiqdir və kitabxana xüsusi simvolları və boşluqları dəqiqliklə asanlıqla aşkar edə bilər.

Python API istifadə edərək OCR Sənəd TanınmasıF həyata keçirin

img_path = './input_images/11-document-1.jpg'
result = ocr.ocr(img_path)

//Displaying the output.

Python Tətbiqlərində Cədvəl Tanıma Dəstəyi

Açıq mənbəli PaddleOCR kitabxanası proqram tərtibatçılarına öz Python proqramlarında cədvəl məlumatlarını tanımağa imkan verir. Cədvəlin tanınması əsasən üç modeldən ibarətdir, tək sətirli mətnin aşkarlanması-DB, tək sətirli mətnin tanınması-CRNN və cədvəl strukturu, həmçinin hüceyrə koordinatlarının proqnozlaşdırılması-SLANet. Aşağıdakı nümunə cədvəli ehtiva edən şəklin necə tanınacağını göstərir. Aşağıdakı nümunə təsviri, məhdudlaşdırıcı qutuları, mətnləri, xalları və şrift faylına gedən yolu götürən draw_ocr metodundan necə istifadə olunacağını göstərir. O, məhdudlaşdırıcı qutuları və aşkar edilmiş mətni olan şəkli qaytarır. Siz şou metodundan istifadə edərək şəkli göstərə bilərsiniz.

Python API vasitəsilə Şəkil Yükləyin və İçində Mətni Aşkarlayın

from paddleocr import PaddleOCR, draw_ocr

# Load the image that contains the table.

# Load the image
img_path = 'table_image.png'
with open(img_path, 'rb') as f:
    img = f.read()

# Create an instance of the PaddleOCR object
ocr = PaddleOCR()


# Draw the bounding boxes around the detected table cells

boxes = [line[0] for line in result]
scores = [line[1] for line in result]
texts = [line[2][0] for line in result]
im_show = draw_ocr(img, boxes, texts, scores, font_path='arial.ttf')
im_show.show()

 Azəri