JS 프로젝트에 OCR 기능을 추가하기 위한 무료 Node.js API.
오픈 소스 Node.js OCR 라이브러리로 이미지(JPEG, PNG), PDF 및 문서 등 다양한 파일 형식에서 텍스트를 무료로 인식하고 추출할 수 있습니다.
Node-Tesseract-OCR란 무엇인가요?
오늘날 디지털 시대에 이미지와 문서에서 텍스트를 추출하는 작업은 문서 관리, 데이터 처리, 인공지능 등 다양한 산업에서 중요한 과제가 되었습니다. 광학 문자 인식(OCR) 기술 덕분에 스캔한 문서, 이미지, PDF를 편집 가능한 텍스트 형식으로 변환할 수 있게 되었습니다. Node-Tesseract-OCR은 Tesseract OCR 엔진의 힘을 결합한 오픈 소스 API로, Node.js 애플리케이션에서 OCR 작업을 원활하고 효율적으로 수행할 수 있도록 합니다.
Node-Tesseract-OCR은 Tesseract OCR 엔진을 위한 Node.js 래퍼로, 소프트웨어 개발자가 Node.js 환경에서 Tesseract의 강력한 텍스트 인식 기능을 활용할 수 있게 합니다. 이 API는 GitHub 저장소에서 관리되며, 간단한 텍스트 추출부터 복잡한 문서 처리 작업까지 다양한 사용 사례에 적합한 기능을 제공합니다. 개발자는 여러 언어로 이미지와 문서에서 텍스트를 추출할 수 있어 다양한 애플리케이션에 활용할 수 있습니다.
Node-Tesseract-OCR API는 이미지 필터링, 리사이징, 크롭 등 고급 이미지 처리 기능을 제공하여 추출된 텍스트의 정확성과 신뢰성을 보장합니다. 100개 이상의 언어를 지원하므로 다양한 환경에서 OCR 작업을 수행하기에 적합합니다. 개발자는 이미지, PDF 및 문서에서 텍스트를 추출하고 JSON, XML, 일반 텍스트 등 다양한 형식으로 반환받을 수 있습니다. 가볍고 유연하며 사용하기 쉬운 설계 덕분에 프로젝트에 OCR 기능을 추가하려는 개발자에게 이상적인 선택입니다. 고급 이미지 처리, 다국어 지원 및 오류 처리 메커니즘을 갖춘 이 라이브러리는 OCR 기능을 프로젝트에 통합하려는 개발자에게 최적의 솔루션입니다.
Node-Tesseract-OCR 시작하기
Node-Tesseract-OCR을 설치하는 가장 권장되는 방법은 npm을 사용하는 것입니다. 원활한 설치를 위해 아래 명령어를 사용하십시오.
npm을 통해 Node-Tesseract-OCR 설치
npm install node-tesseract-ocr 수동으로 설치하려면 최신 릴리스 파일을 GitHub 저장소에서 직접 다운로드하십시오.
Node.js API에서 이미지 텍스트 추출
오픈 소스 Node-Tesseract-OCR 라이브러리를 사용하면 소프트웨어 개발자가 Node.js 애플리케이션 내에서 이미지에서 텍스트를 자동으로 추출하는 애플리케이션을 쉽게 만들 수 있습니다. 스캔한 문서, PDF, 카메라 사진 또는 영수증 사진에서 텍스트를 추출할 수 있어 검색 가능한 아카이브 생성, 데이터 입력 자동화, 대량 문서 처리 등에 유용합니다. 아래 예시는 Node.js 애플리케이션에서 이미지의 텍스트를 프로그래밍 방식으로 추출하는 간단한 예시입니다.
Node.js 환경에서 이미지 텍스트를 추출하는 방법
const tesseract = require("node-tesseract-ocr");
tesseract.recognize("path/to/image.jpg")
.then(text => {
console.log("Recognized Text:", text);
})
.catch(error => {
console.error("Error:", error.message);
});
Node.js에서 이미지 전처리 향상
OCR을 적용하기 전에 이미지를 전처리하면 텍스트 인식 정확도가 크게 향상됩니다. 오픈 소스 Node-Tesseract-OCR 라이브러리는 리사이징, 이진화, 기울기 보정 등 기본 전처리 기술을 지원합니다. 이러한 전처리 단계는 sharp 또는 jimp와 같은 추가 Node.js 라이브러리와 결합하여 구현할 수 있습니다. 아래 예시는 저품질 이미지에서 인식을 개선하기 위해 전처리 단계를 사용하는 방법을 보여줍니다.
Node.js API를 통해 전처리 단계를 적용하여 인식률을 높이는 방법
const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");
sharp("path/to/input.jpg")
.resize(800, 600) // 이미지 리사이즈
.greyscale() // 그레이스케일 변환
.toBuffer()
.then(data => {
return tesseract.recognize(data, { lang: "eng" });
})
.then(text => {
console.log("Preprocessed Image Text:", text);
})
.catch(error => {
console.error("Error:", error.message);
});
다국어 텍스트 인식
Node-Tesseract-OCR의 가장 큰 장점 중 하나는 방대한 다국어 지원입니다. Tesseract OCR 라이브러리는 100개 이상의 언어를 지원하므로 다양한 언어로 된 문서를 처리해야 하는 애플리케이션에 이상적입니다. 개발자는 Tesseract가 사용할 언어를 지정하여 비영어 텍스트에 대한 인식 정확도를 높일 수 있습니다. 아래 예시는 Node.js 애플리케이션에서 프랑스어 텍스트를 인식하는 방법을 보여줍니다.
JavaScript API를 통해 프랑스어 이미지 텍스트를 인식하는 방법
const config = {
lang: "fra", // 프랑스어 지원
oem: 1,
psm: 3
};
tesseract.recognize("path/to/french-text-image.jpg", config)
.then(text => {
console.log("Recognized Text in French:", text);
})
.catch(error => {
console.error("Error:", error.message);
});