Free JavaScript Library to Parse Text from Scanned Images & Forms

Open Source Optical Character Recognition (OCR) JavaScript library for Parsing Text from Black-&-White Scanned Images & Documents with Image Preprocessing & Templates Support in Web or Node.js Apps.

Müasir rəqəmsal dünyada optik simvol tanıma (OCR) texnologiyası skann edilmiş şəkilləri, əl yazısı qeydləri və ya çap edilmiş sənədləri redaktə edilə bilən və axtarıla bilən məlumatlara çevirmədə kritik rol oynayır. Yüngül və açıq mənbəli həll axtaran JavaScript tərtibatçıları üçün Guten OCR cəlbedici bir seçim təqdim edir. Bu JavaScript‑əsaslı OCR mühərriki sadəliyi nəzərə alaraq hazırlanıb, brauzer‑əsaslı və ya Node.js tətbiqlərinə OCR funksionallığını birbaşa inteqrasiya etmək üçün idealdır. Kitabxananın bir neçə vacib xüsusiyyəti var, məsələn şablonlar vasitəsilə simvol tanıma, şəkil həddi və ikiliyə çevrilmə, simvol seqmentləşməsi, şablon uyğunluğu və mətn birləşməsi, modul kod bazası dəstəyi və s. O, qara‑ağ skann edilmiş sənədlərdə çap edilmiş mətnin tanınmasına yönəlib və kitablar və ya formalara bənzər yaxşı formatlanmış mətnlər üçün ən uyğundur.

Guten OCR, Gutenye tərəfindən yaradılmış açıq mənbəli JavaScript OCR mühərrikidir. Çıxarıcı asılılıqları və ya geniş quraşdırma tələb edən ağır OCR alətlərindən fərqli olaraq, Guten OCR tamamilə JavaScript‑də yazılıb, yəni veb brauzerində və ya Node.js serverində işləyə bilir. Kitabxana əsas şəkil emalı texnikalarından istifadə edərək simvolları seqmentləşdirir və onları simvol nümunəsi tanıma sistemi ilə müəyyən edir. Hələ ki, Tesseract kimi kommersiya OCR mühərrikləri ilə çoxdilli və ya əl yazısı mətn dəstəyi baxımından rəqabətə gələ bilməsə də, sadəliyi və hack‑edilə bilən strukturu onu tədris layihələri, sübut‑konsepsiyaları və ya xüsusi veb tətbiqlərində OCR funksionallığını yerləşdirmək üçün fantastik bir seçim edir. Tesseract və ya digər böyük mühərriklərdən fərqli olaraq, Guten OCR şübhəsiz ki, yüngül və fokuslanmışdır — OCR‑nin arxa planda necə işlədiyini anlamaq istəyənlər üçün mükəmməl bir başlanğıc nöqtəsidir.

Ümumi Baxış

Guten OCR xüsusiyyətlərinin ümumi icmalı.

Xüsusiyyətlər İcmalı

Şəkillərin Mətnini Parçala
Şəkillərdə OCR Tətbiq Et
Şəkil mətnini tanı
Mətn şəkillərinə çevir
Tanınan Şrift mətnləri
Şəkil Ön Emalı
OCR üçün Şablonlardan İstifadə Et
OCR tətbiqləri yarat
Brauzerdə saxla
Mətni çıxar
Çox-işləmə Dəstəyi

Guten OCR

Guten OCR aşağıdakı populyar şəkil fayl formatlarını dəstəkləyir.

Oxuyucu

PNG, JPEG, BMP, TIFF, TGA, DICOM

Yazıcı

PNG, JPEG, BMP, TIFF

Guten OCR

Platforma Müstəqilliyi

Guten OCR istənilən Java əsaslı proqramlaşdırma dili ilə işləyə bilər.

Java-iş vaxtı

Guten OCR

Guten OCR‑a Başlamaq

Guten OCR‑u quraşdırmağın tövsiyə olunan yolu Brew‑dən istifadə etməkdir. Sorunsuz quraşdırma üçün aşağıdakı əmri işlədin.

Brew vasitəsilə Guten OCR‑u Quraşdırın

 brew install git-lfs

GitHub vasitəsilə Guten OCR‑u Quraşdırın

 git clone git@github.com:gutenye/ocr.git

Həmçinin onu əl ilə də quraşdıra bilərsiniz; ən son buraxılış fayllarını birbaşa GitHub repozitoriyasından yükləyin.

OCR Əməliyyatlarından Əvvəl Şəkil Ön Emalı

Açıq mənbəli Guten OCR kitabxanası tamamilə JavaScript‑də yazılıb, həm brauzer, həm də Node.js mühitləri ilə uyğun gəlir. Tanıma dəqiqliyini artırmaq üçün daxili şəkil ön emalı funksiyaları mövcuddur. Şəkil ikiliyə çevirmə (qara‑ağ), səs-küy azaldılması, əyilmə (skew) düzəlişi və daha çoxunu dəstəkləyir. Aşağıdakı nümunə, tərtibatçıların şəkillərdə OCR əməliyyatını icra etməzdən əvvəl bir neçə ön emal addımını necə tətbiq edə biləcəyini göstərir.

JavaScript Kitabxanası vasitəsilə OCR‑dan əvvəl Şəkil Ön Emalını Necə Tətbiq Etmək Olar?

const { preprocess } = require('guten-ocr');

// Apply multiple preprocessing steps
const processedImage = preprocess(imageData, [
  'grayscale',    // Convert to grayscale
  'binarize',     // Convert to black and white
  'deskew',       // Correct skew
  'denoise'       // Reduce noise
]);

// Then perform OCR on the processed image
ocr.recognize(processedImage).then(/* ... */);

Şablonlar vasitəsilə Simvol Tanıma

JavaScript kitabxanası Guten OCR, JavaScript tətbiqlərində şablonlar vasitəsilə OCR əməliyyatlarını tam dəstəkləyir. Guten OCR‑un əsasını şablon‑uyğunluq sistemi təşkil edir. Maşın öyrənmə modeli təlimi yerinə, əvvəlcədən müəyyən edilmiş simvol nümunələrindən istifadə edir. Bu, sistemi daha sürətli və anlaşıqlı edir, lakin şrift və tərtibat uyğunluğuna daha həssas olur. Kitabxana hər bir simvolu (A–Z, a–z, 0–9, və s.) kanvasa çəkməklə, ikili matris yaradır və bu matris referans şablonu kimi saxlayır. Şəkil analiz edərkən, kitabxana şəkil seqmentlərini bu şablonlarla müqayisə edərək ən uyğun uyğunluğu tapır. Bu, şaquli və üfüqi xətt skanını birləşdirərək bağlayıcı qutuları müəyyən etmək üçün istifadə olunur.

OCR Kitabxanası vasitəsilə Simvol Seqmentləşdirmə

Açıq mənbəli JavaScript kitabxanası Guten OCR, proqramçılara simvol seqmentləşdirməni asanlıqla həyata keçirməyə imkan verir. Şəkil ikiliyə çevrildikdən sonra növbəti addım fərdi simvolların seqmentləşdirilməsidir. Guten OCR, sıx qara piksellərlə dolu bölgələri aşkar etmək üçün sətir və sütunları skan edir və onları potensial simvollara ayırır. Aşağıdakı nümunə, proqramçının JavaScript OCR kitabxanası vasitəsilə simvol seqmentləşdirməsini necə həyata keçirə biləcəyini göstərir.

JavaScript Kitabxanası vasitəsilə Simvol Seqmentləşdirməsini Necə İcra Etmək Olar?

const segment = require('guten-ocr/segment');
const boxes = segment(binarized); // returns array of [x, y, width, height]