JS 프로젝트에 OCR 기능을 추가하기 위한 무료 Node.js API.

오픈 소스 Node.js OCR 라이브러리로 이미지(JPEG, PNG), PDF 및 문서 등 다양한 파일 형식에서 텍스트를 무료로 인식하고 추출할 수 있습니다.

Node-Tesseract-OCR란 무엇인가요?

오늘날 디지털 시대에 이미지와 문서에서 텍스트를 추출하는 작업은 문서 관리, 데이터 처리, 인공지능 등 다양한 산업에서 중요한 과제가 되었습니다. 광학 문자 인식(OCR) 기술 덕분에 스캔한 문서, 이미지, PDF를 편집 가능한 텍스트 형식으로 변환할 수 있게 되었습니다. Node-Tesseract-OCR은 Tesseract OCR 엔진의 힘을 결합한 오픈 소스 API로, Node.js 애플리케이션에서 OCR 작업을 원활하고 효율적으로 수행할 수 있도록 합니다.

Node-Tesseract-OCR은 Tesseract OCR 엔진을 위한 Node.js 래퍼로, 소프트웨어 개발자가 Node.js 환경에서 Tesseract의 강력한 텍스트 인식 기능을 활용할 수 있게 합니다. 이 API는 GitHub 저장소에서 관리되며, 간단한 텍스트 추출부터 복잡한 문서 처리 작업까지 다양한 사용 사례에 적합한 기능을 제공합니다. 개발자는 여러 언어로 이미지와 문서에서 텍스트를 추출할 수 있어 다양한 애플리케이션에 활용할 수 있습니다.

Node-Tesseract-OCR API는 이미지 필터링, 리사이징, 크롭 등 고급 이미지 처리 기능을 제공하여 추출된 텍스트의 정확성과 신뢰성을 보장합니다. 100개 이상의 언어를 지원하므로 다양한 환경에서 OCR 작업을 수행하기에 적합합니다. 개발자는 이미지, PDF 및 문서에서 텍스트를 추출하고 JSON, XML, 일반 텍스트 등 다양한 형식으로 반환받을 수 있습니다. 가볍고 유연하며 사용하기 쉬운 설계 덕분에 프로젝트에 OCR 기능을 추가하려는 개발자에게 이상적인 선택입니다. 고급 이미지 처리, 다국어 지원 및 오류 처리 메커니즘을 갖춘 이 라이브러리는 OCR 기능을 프로젝트에 통합하려는 개발자에게 최적의 솔루션입니다.

한눈에 보기

Node-Tesseract-OCR 기능 개요.

기능 개요

OCR 수행
OCR 기능 추가
이미지 텍스트 인식
텍스트 이미지 변환
폰트 텍스트 인식
PDF 검색
100개 이상 언어 지원
OCR 앱 만들기
브라우저에 저장
텍스트 추출
멀티스레드 지원

Node-Tesseract-OCR

Node-Tesseract-OCR은 아래에 나열된 인기 이미지 파일 형식을 지원합니다.

리더

PNG, JPEG, BMP, TIFF, TGA, DICOM

라이터

PNG, JPEG, BMP, TIFF

Node-Tesseract-OCR

플랫폼 독립성

Node-Tesseract-OCR은 Java 기반 프로그래밍 언어와 함께 사용할 수 있습니다.

Java

Node-Tesseract-OCR

Node-Tesseract-OCR 시작하기

Node-Tesseract-OCR을 설치하는 가장 권장되는 방법은 npm을 사용하는 것입니다. 원활한 설치를 위해 아래 명령어를 사용하십시오.

npm을 통해 Node-Tesseract-OCR 설치

npm install node-tesseract-ocr

수동으로 설치하려면 최신 릴리스 파일을 GitHub 저장소에서 직접 다운로드하십시오.

Node.js API에서 이미지 텍스트 추출

오픈 소스 Node-Tesseract-OCR 라이브러리를 사용하면 소프트웨어 개발자가 Node.js 애플리케이션 내에서 이미지에서 텍스트를 자동으로 추출하는 애플리케이션을 쉽게 만들 수 있습니다. 스캔한 문서, PDF, 카메라 사진 또는 영수증 사진에서 텍스트를 추출할 수 있어 검색 가능한 아카이브 생성, 데이터 입력 자동화, 대량 문서 처리 등에 유용합니다. 아래 예시는 Node.js 애플리케이션에서 이미지의 텍스트를 프로그래밍 방식으로 추출하는 간단한 예시입니다.

Node.js 환경에서 이미지 텍스트를 추출하는 방법

const tesseract = require("node-tesseract-ocr");

tesseract.recognize("path/to/image.jpg")
  .then(text => {
    console.log("Recognized Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Node.js에서 이미지 전처리 향상

OCR을 적용하기 전에 이미지를 전처리하면 텍스트 인식 정확도가 크게 향상됩니다. 오픈 소스 Node-Tesseract-OCR 라이브러리는 리사이징, 이진화, 기울기 보정 등 기본 전처리 기술을 지원합니다. 이러한 전처리 단계는 sharp 또는 jimp와 같은 추가 Node.js 라이브러리와 결합하여 구현할 수 있습니다. 아래 예시는 저품질 이미지에서 인식을 개선하기 위해 전처리 단계를 사용하는 방법을 보여줍니다.

Node.js API를 통해 전처리 단계를 적용하여 인식률을 높이는 방법

const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");

sharp("path/to/input.jpg")
  .resize(800, 600) // 이미지 리사이즈
  .greyscale() // 그레이스케일 변환
  .toBuffer()
  .then(data => {
    return tesseract.recognize(data, { lang: "eng" });
  })
  .then(text => {
    console.log("Preprocessed Image Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

다국어 텍스트 인식

Node-Tesseract-OCR의 가장 큰 장점 중 하나는 방대한 다국어 지원입니다. Tesseract OCR 라이브러리는 100개 이상의 언어를 지원하므로 다양한 언어로 된 문서를 처리해야 하는 애플리케이션에 이상적입니다. 개발자는 Tesseract가 사용할 언어를 지정하여 비영어 텍스트에 대한 인식 정확도를 높일 수 있습니다. 아래 예시는 Node.js 애플리케이션에서 프랑스어 텍스트를 인식하는 방법을 보여줍니다.

JavaScript API를 통해 프랑스어 이미지 텍스트를 인식하는 방법

const config = {
  lang: "fra", // 프랑스어 지원
  oem: 1,
  psm: 3
};

tesseract.recognize("path/to/french-text-image.jpg", config)
  .then(text => {
    console.log("Recognized Text in French:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });