ProductName: OCR Githublink: https://github.com/sebastianstarke/OCR ListingPage_Short_Description: Optical Character Recognition in Chinese Letter Manuscripts (C++) uses simple engine which is a character based system that employs template matching techniques to recognize printed characters. ListingPage_Product_Small_Image: listing-image.png

Çince El Yazmaları için Ücretsiz Optik Karakter Tanıma API'si

Şablon tabanlı eşleştirme kullanarak Çince el yazmaları üzerinde OCR işlemleri gerçekleştiren Açık Kaynak C++ OCR, karakterler bilinen örneklerle piksel bazında eşleştirilir.

Ücretsiz C++ OCR Nedir?

Optik Karakter Tanıma (OCR), Latin dışı alfabelerde—özellikle Çince—karakterlerin karmaşıklığı ve çeşitliliği nedeniyle benzersiz zorluklar sunar. Neyse ki, Sebastian Starke tarafından geliştirilen açık kaynaklı OCR C++ API'si, özellikle el yazması kaynaklarından basılı veya el yazması Çince karakterleri tanımak için tasarlanmış temiz, genişletilebilir bir çözüm sunar. Basitlik ve uyarlanabilirlik düşünülerek tasarlanan bu hafif API, yazılım geliştiricilerin ağır makine öğrenimi modelleri yerine klasik görüntü işleme yöntemleriyle karakter tanıma denemeleri yapmalarını sağlar.

Bu proje, Tesseract gibi tam ölçekli bir sinirsel OCR motoru değildir. Bunun yerine farklı bir yol izler: karakterleri bilinen örneklerle piksel bazında eşleştiren şablon tabanlı eşleştirme kullanır. Bu, eğitim amaçlı kullanım, kontrollü ortamlar veya tarihî el yazması analizi, geleneksel Çince tipografi veya basitleştirilmiş el yazısı veri setleri gibi belirli tanıma görevleri için idealdir. Proje, gömülü Linux sistemleri, Raspberry Pi veya endüstriyel tarama cihazları gibi düşük kaynaklı ortamlarda çalışan geliştiriciler için özellikle uygundur; çünkü ağır bağımlılıklara veya derin öğrenme kütüphanelerine dayanmaz.

Genel Bakış

OCR özelliklerinin bir genel bakışı.

Features Overview

Çince-OCR
OCR Yeteneği Ekle
Görüntü Metnini Tanı
Metin Görüntülerini Dönüştür
Tanınan Yazı Tipi Metni
Diğer Diller Desteği
OCR Uygulamaları Oluştur
Görüntü Ön İşleme
Metin Çıkar
Çok İşlem Desteği

OCR

OCR, aşağıda listelenen popüler görüntü dosya formatlarını destekler.

Okuyucu

PNG, JPEG, BMP, TIFF, TGA, DICOM

Yazıcı

PNG, JPEG, BMP, TIFF

OCR

Platform Bağımsızlığı

OCR, herhangi bir C++ tabanlı programlama diliyle çalışabilir.

C++ çalışma zamanı.

OCR

OCR ile Başlarken

OCR'yi kurmanın önerilen yolu GitHub kullanmaktır. Sorunsuz bir kurulum için lütfen aşağıdaki komutu kullanın.

Install OCR API via GitHub

 git clone https://github.com/sebastianstarke/OCR.git

You can also install it manually; download the latest release files directly from GitHub repository.

Şablon Tabanlı OCR Motoru

The open source optical character recognition (OCR) in Chinese manuscripts C++ API has provided complete support for using Template-Based OCR Engine inside C++ apps. At the heart of this library lies a classic image comparison system: character images are binarized and then compared against templates using a distance metric (typically pixel-wise comparison). For Chinese, this is particularly useful when dealing with consistent calligraphy or printed manuscripts.

How to Perform Template-Based OCR Recognition in C++ apps?

OCR::TemplateCollection templates;
templates.loadFromFolder("templates/"); // Load preprocessed characters

OCR::Recognizer recognizer(templates);
std::string recognizedText = recognizer.recognizeFromImage("scanned_page.png");

Görüntü Ön İşleme Desteği

The open source OCR library has provide complete support for image preprocessing functionality inside C++ applications. The library offers basic preprocessing like thresholding and cropping to clean up noisy inputs. Chinese manuscripts are often written on aged paper, so image cleanup is essential for accurate results. The following example demonstrates, how with just a couple of lines of C++ code software developers can perform image preprocessing.

How to Perform Image Preprocessing before OCR Operations inside C++ APPs?

OCR::ImageProcessor processor;
cv::Mat cleanImage = processor.binarize("raw_scan.png");

Morfolojik Dönüşümler Desteği

The process begins with a series of morphological transformations. These are fundamental image processing operations that modify the geometry of features in an image. In this context, they are used to clean up the manuscript image, removing noise, and preparing the characters for segmentation.