1. 제품
  2.   OCR
  3.   JavaScript
  4.   Tesseract.js
 
  

웹 앱에 OCR을 추가 및 관리하는 오픈 소스 JavaScript API

JS 웹 앱에 광학 문자 인식(OCR) 기능을 추가하고 인쇄되거나 손으로 쓴 텍스트의 이미지를 기계가 읽을 수 있는 텍스트로 무료로 변환하기 위한 최고의 무료 JavaScript 라이브러리입니다.

Tesseract.js는 소프트웨어 개발자가 최소한의 노력과 비용으로 광학 문자 인식(OCR) 기능을 웹 애플리케이션 내에 통합할 수 있게 해주는 매우 유용한 오픈 소스 JavaScript 라이브러리입니다. OCR은 인쇄되거나 손으로 쓴 텍스트의 이미지를 기계가 읽을 수 있는 텍스트로 변환하는 프로세스입니다. Tesseract.js는 원래 1980년대 Hewlett-Packard에서 개발하고 나중에 Google에서 유지 관리하는 인기 있는 Tesseract OCR 엔진의 포트입니다. Tesseract.js는 100개 이상의 언어를 인식할 수 있으므로 웹 애플리케이션에 OCR 기능을 추가하려는 개발자에게 강력한 도구입니다.

Tesseract.js는 다루기가 매우 쉽고 스캔한 문서, 영수증, 명함에서 텍스트 추출, 데이터 입력 작업 자동화, 웹 애플리케이션 내 검색 기능 강화 등 다양한 작업에 사용할 수 있습니다. Tesseract.js의 주요 장점 중 하나는 입력 이미지의 품질이나 해상도가 좋지 않은 경우에도 텍스트를 인식할 수 있다는 것입니다. 라이브러리는 기계 학습 알고리즘을 사용하여 OCR 결과의 정확성을 향상시킵니다. 또한 페이지 레이아웃 분석을 수행하고 이미지 내에서 관심 영역을 감지할 수도 있습니다.

Tesseract.js는 사용 용이성과 강력한 OCR 기능으로 인해 인기를 얻고 있으며 브라우저나 NodeJS가 있는 서버에서 원활하게 실행될 수 있습니다. 소프트웨어 개발자가 언어, 페이지 분할 모드 및 화이트리스트 문자와 같은 OCR 옵션을 구성할 수 있는 간단한 API를 제공합니다. 품질이 낮은 이미지에서 텍스트를 인식하는 기능과 다국어 지원을 통해 다양한 애플리케이션에 유용한 도구가 되며 웹 애플리케이션에 OCR을 추가하려는 개발자에게 탁월한 선택이 됩니다.

Previous Next

Tesseract.js 시작하기

Tesseract.js를 설치하는 권장 방법은 npm을 사용하는 것입니다. 원활한 설치를 위해 다음 명령어를 사용해주세요

npm을 통해 Tesseract.js 설치

 npm install tesseract.js

수동으로 설치할 수도 있습니다. GitHub 저장소에서 직접 최신 릴리스 파일을 다운로드하세요.

JavaScript API를 통해 이미지를 텍스트로 변환

오픈 소스 JavaScript 라이브러리 Tesseract.js를 사용하면 소프트웨어 개발자가 BMP, JPG, PNG, PBM, WebP 등과 같은 다양한 유형의 이미지로 쉽게 작업할 수 있습니다. 라이브러리는 이미지, PDF 및 스캔한 문서의 텍스트 처리를 자동화하기 위해 이미지에서 텍스트 추출을 지원합니다. 다음 예제에서는 단 몇 줄의 코드만으로 이미지를 로드하고 이미지에서 텍스트를 추출하는 방법을 보여줍니다. 언어 인수는 이미지 처리에 사용할 학습된 언어 데이터를 결정하는 데 사용됩니다. 소프트웨어 개발자는 여기에서 여러 언어를 사용할 수 있습니다.

JavaScript API를 사용하여 이미지를 텍스트로 변환하는 방법은 무엇입니까?

Tesseract.recognize(
  image,language,
  { 
    logger: m => console.log(m) 
  }
)
.catch (err => {
  console.error(err);
})
.then(result => {
 console.log(result);
})
}

JS API를 통해 이미지 영역 읽기 및 텍스트 추출

오픈 소스 JavaScript 라이브러리에는 이미지 내의 특정 영역을 읽고 JavaScript 애플리케이션 내에서 해당 데이터를 캡처하는 데 매우 유용한 기능이 포함되어 있습니다. API는 이미지 영역 캡처를 지원하고 내부의 강력한 OCR 엔진을 사용하여 이 영역 내부의 텍스트를 인식하려고 시도합니다. 다음 예는 소프트웨어 개발자가 이미지에 URL을 제공하고 API가 선택한 영역에서 텍스트를 쉽게 감지하고 인식할 수 있는 방법을 보여줍니다.

JS API를 통해 이미지의 선택된 영역에 있는 텍스트 읽기 및 인식

const { createWorker } = require('tesseract.js');

const worker = await createWorker();
const rectangle = { left: 0, top: 0, width: 500, height: 250 };

(async () => {
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png', { rectangle });
  console.log(text);
  await worker.terminate();
})();
 한국인