Gratis optisk teckenigenkännings‑API för kinesiska manuskript

Öppen källkod C++ OCR för att utföra OCR‑operationer på kinesiska manuskript med mallbaserad matchning, där tecken matchas pixel för pixel mot kända exempel.

Vad är Gratis C++ OCR?

Optical Character Recognition (OCR) i icke‑latinska skriftsystem—särskilt kinesiska—utgör unika utmaningar på grund av teckenens komplexitet och variation. Lyckligtvis erbjuder den open‑source OCR C++‑API:n av Sebastian Starke en ren, utbyggbar lösning som är anpassad för att känna igen tryckta eller handskrivna kinesiska tecken, särskilt från manuskriptkällor. Designad med enkelhet och anpassningsförmåga i åtanke möjliggör detta lätta API för mjukvaruutvecklare att experimentera med teckenigenkänning med klassiska bildbehandlingsmetoder snarare än tunga maskininlärningsmodeller.

Detta projekt är inte en fullskalig neural OCR‑motor som Tesseract. Istället tar det en annan väg: det använder mallbaserad matchning, där tecken matchas pixel för pixel mot kända exempel. Det gör det idealiskt för utbildningsbruk, kontrollerade miljöer eller specifika igenkänningsuppgifter som historisk manuskriptanalys, traditionella kinesiska typsnitt eller förenklade handskriftsdatamängder. Projektet är särskilt lämpligt för utvecklare som arbetar i resurssvaga miljöer, såsom inbäddade Linux‑system, Raspberry Pi eller industriella skanningsenheter, eftersom det inte är beroende av tunga beroenden eller djupinlärningsbibliotek.

Översikt

En översikt av OCR‑funktioner.

Funktionsöversikt

Kinesisk OCR
Lägg till OCR‑funktioner
Känn igen bildtext
Konvertera bilder av text
Känd teckensnittstext
Stöd för andra språk
Skapa OCR‑appar
Bildförbehandling
Extrahera text
Stöd för flertrådad körning

OCR

OCR stöder populära bildfilformat som listas nedan.

Läsare

PNG, JPEG, BMP, TIFF, TGA, DICOM

Skrivare

PNG, JPEG, BMP, TIFF

OCR

Plattformsoberoende

OCR kan fungera med vilket C++‑baserat programmeringsspråk som helst.

C++ runtime.

OCR

Komma igång med OCR

Det rekommenderade sättet att installera OCR är att använda GitHub. Använd följande kommando för en smidig installation.

Install OCR API via GitHub

 git clone https://github.com/sebastianstarke/OCR.git

Du kan också installera det manuellt; ladda ner de senaste release‑filerna direkt från GitHub-arkivet.

Mallbaserad OCR‑motor

Det öppna källkods‑API:t för optisk teckenigenkänning (OCR) i kinesiska manuskript i C++ har fullständigt stöd för att använda en mallbaserad OCR‑motor i C++‑applikationer. I kärnan av detta bibliotek ligger ett klassiskt bildjämförelsesystem: teckenbilder binäriseras och jämförs sedan mot mallar med hjälp av ett avståndsmått (vanligtvis pixel‑för‑pixel‑jämförelse). För kinesiska är detta särskilt användbart när man hanterar enhetlig kalligrafi eller tryckta manuskript.

Hur utför man mallbaserad OCR‑igenkänning i C++‑appar?

OCR::TemplateCollection templates;
templates.loadFromFolder("templates/"); // Load preprocessed characters

OCR::Recognizer recognizer(templates);
std::string recognizedText = recognizer.recognizeFromImage("scanned_page.png");

Stöd för bildförbehandling

Det öppna källkods‑OCR‑biblioteket har komplett stöd för bildförbehandlingsfunktioner i C++‑applikationer. Biblioteket erbjuder grundläggande förbehandling som tröskling och beskärning för att rensa upp brusiga indata. Kinesiska manuskript skrivs ofta på åldrat papper, så bildrengöring är avgörande för korrekta resultat. Följande exempel visar hur man med bara ett par rader C++‑kod kan utföra bildförbehandling.

Hur utför man bildförbehandling före OCR‑operationer i C++‑appar?

OCR::ImageProcessor processor;
cv::Mat cleanImage = processor.binarize("raw_scan.png");

Stöd för morfologiska transformationer

Processen börjar med en serie morfologiska transformationer. Dessa är grundläggande bildbehandlingsoperationer som ändrar geometrin hos funktioner i en bild. I detta sammanhang används de för att rensa upp manuskriptbilden, ta bort brus och förbereda tecknen för segmentering.