Kostenlose Optische Zeichenerkennungs-API für chinesische Manuskripte

Open-Source C++ OCR, um OCR-Operationen an chinesischen Manuskripten durchzuführen, wobei vorlagenbasiertes Matching verwendet wird, bei dem Zeichen pixelweise mit bekannten Mustern verglichen werden.

Was ist kostenloses C++ OCR?

Optische Zeichenerkennung (OCR) in nicht‑lateinischen Schriftsystemen – insbesondere Chinesisch – stellt aufgrund der Komplexität und Vielfalt der Zeichen einzigartige Herausforderungen dar. Glücklicherweise bietet die Open‑Source‑OCR‑C++‑API von Sebastian Starke eine saubere, erweiterbare Lösung, die speziell für die Erkennung gedruckter oder handgeschriebener chinesischer Zeichen aus Manuskriptquellen entwickelt wurde. Sie ist auf Einfachheit und Anpassungsfähigkeit ausgelegt und ermöglicht es Softwareentwicklern, mit klassischer Bildverarbeitung statt schwergewichtiger Machine‑Learning‑Modelle zu experimentieren.

Dieses Projekt ist kein vollwertiger neuronaler OCR‑Motor wie Tesseract. Stattdessen verfolgt es einen anderen Ansatz: Es verwendet vorlagenbasiertes Matching, bei dem Zeichen pixelweise mit bekannten Mustern verglichen werden. Das macht es ideal für den Einsatz in der Ausbildung, kontrollierten Umgebungen oder für spezifische Erkennungsaufgaben wie die Analyse historischer Manuskripte, traditionelle chinesische Satzarten oder vereinfachte Handschriftdatensätze. Das Projekt eignet sich besonders für Entwickler, die in ressourcenarmen Umgebungen arbeiten, etwa auf eingebetteten Linux‑Systemen, Raspberry Pi oder industriellen Scangeräten, da es nicht von schweren Abhängigkeiten oder Deep‑Learning‑Bibliotheken abhängt.

Auf einen Blick

Ein Überblick über OCR‑Funktionen.

Features Overview

Chinesisch-OCR
OCR‑Funktionen hinzufügen
Bildtext erkennen
Bilder von Text konvertieren
Erkannten Schrifttext
Unterstützung anderer Sprachen
OCR‑Anwendungen erstellen
Bildvorverarbeitung
Text extrahieren
Unterstützung für Multithreading

OCR

OCR unterstützt die unten aufgeführten gängigen Bilddateiformate.

Leser

PNG, JPEG, BMP, TIFF, TGA, DICOM

Schreiber

PNG, JPEG, BMP, TIFF

OCR

Plattformunabhängigkeit

OCR kann mit jeder C++‑basierten Programmiersprache arbeiten.

C++‑Laufzeit.

OCR

Erste Schritte mit OCR

Der empfohlene Weg, OCR zu installieren, ist über GitHub. Bitte verwenden Sie den folgenden Befehl für eine reibungslose Installation.

OCR‑API über GitHub installieren

 git clone https://github.com/sebastianstarke/OCR.git

Sie können es auch manuell installieren; laden Sie die neuesten Release‑Dateien direkt aus dem GitHub-Repository herunter.

Vorlagenbasierter OCR‑Motor

Die Open‑Source‑Optische‑Zeichenerkennungs‑API (OCR) für chinesische Manuskripte in C++ bietet vollständige Unterstützung für die Verwendung eines vorlagenbasierten OCR‑Motors in C++‑Anwendungen. Im Kern dieser Bibliothek steht ein klassisches Bildvergleichssystem: Zeichenbilder werden binarisiert und anschließend mittels einer Distanzmetrik (typischerweise pixelweiser Vergleich) mit Vorlagen verglichen. Für Chinesisch ist dies besonders nützlich, wenn es um konsistente Kalligraphie oder gedruckte Manuskripte geht.

Wie führt man vorlagenbasierte OCR‑Erkennung in C++‑Apps durch?

OCR::TemplateCollection templates;
templates.loadFromFolder("templates/"); // Load preprocessed characters

OCR::Recognizer recognizer(templates);
std::string recognizedText = recognizer.recognizeFromImage("scanned_page.png");

Unterstützung für Bildvorverarbeitung

Die Open‑Source‑OCR‑Bibliothek bietet vollständige Unterstützung für Bildvorverarbeitungs‑Funktionalitäten in C++‑Anwendungen. Die Bibliothek stellt grundlegende Vorverarbeitung wie Schwellenwertbildung und Zuschneiden bereit, um verrauschte Eingaben zu bereinigen. Chinesische Manuskripte liegen häufig auf gealtertem Papier vor, sodass die Bildreinigung für genaue Ergebnisse unerlässlich ist. Das folgende Beispiel zeigt, wie Entwickler mit nur wenigen Zeilen C++‑Code Bildvorverarbeitung durchführen können.

Wie führt man Bildvorverarbeitung vor OCR‑Operationen in C++‑Apps durch?

OCR::ImageProcessor processor;
cv::Mat cleanImage = processor.binarize("raw_scan.png");

Unterstützung für morphologische Transformationen

Der Prozess beginnt mit einer Reihe morphologischer Transformationen. Dies sind grundlegende Bildverarbeitungs‑Operationen, die die Geometrie von Merkmalen in einem Bild verändern. In diesem Kontext werden sie verwendet, um das Manuskriptbild zu säubern, Rauschen zu entfernen und die Zeichen für die Segmentierung vorzubereiten.