1. 제품
  2.   OCR
  3.   Ruby
  4.   Ruby-Tesseract-OCR
 
  

이미지에서 텍스트를 로드하고 추출하는 고급 무료 Ruby 라이브러리

소프트웨어 개발자가 이미지(스캔 이미지 및 PDF 파일)에서 텍스트를 로드, 인식 및 추출할 수 있는 선도적인 오픈 소스 Ruby OCR API 및 이미지-텍스트 변환기

광학 문자 인식(OCR)은 컴퓨터가 이미지나 스캔한 문서에서 텍스트를 인식하고 추출할 수 있게 해주는 강력한 기술입니다. 인쇄 자료의 디지털화부터 데이터 입력 프로세스 자동화까지 다양한 응용 분야가 있습니다. Ruby 프로그래밍 언어에서 널리 사용되는 OCR 라이브러리 중 하나는 Ruby-Tesseract-OCR입니다. Ruby-Tesseract-OCR은 Tesseract OCR 엔진의 래퍼 역할을 하는 Ruby gem입니다. Tesseract는 Google에서 개발한 오픈소스 OCR 엔진으로 정확성과 언어 지원으로 유명합니다.

Ruby-Tesseract-OCR은 기본 OCR 기능을 뛰어넘어 고급 사용 사례를 위한 추가 기능을 제공합니다. 예를 들어, 소프트웨어 개발자는 이미지 내에서 관심 영역(ROI)을 지정하여 OCR 분석을 특정 영역으로 제한할 수 있습니다. 이는 복잡한 문서를 처리하거나 특정 섹션에서만 텍스트를 추출해야 할 때 특히 유용합니다. 라이브러리는 기존 이미지 로드, 이미지 또는 스캔한 문서에서 텍스트 추출, HOCR(HTML OCR) 출력 가져오기 등 OCR 기능을 향상시키는 여러 추가 기능을 제공합니다.

Ruby-Tesseract-OCR gem은 Tesseract 엔진과 상호 작용할 수 있는 사용하기 쉬운 인터페이스를 제공하므로 Ruby 개발자는 OCR 기능을 프로젝트에 쉽게 통합할 수 있습니다. 송장에서 정보를 추출하거나, 인쇄물을 디지털화하거나, 데이터 입력 작업을 자동화해야 하는 경우 오픈 소스 라이브러리는 안정적이고 효율적인 솔루션을 제공합니다. 지금 당장 Ruby 프로젝트에서 OCR의 잠재력을 발휘해 보세요.

Previous Next

Ruby-Tesseract-OCR 시작하기

Ruby-Tesseract-OCR을 설치하는 권장 방법은 Rubygems를 사용하는 것입니다. 원활한 설치를 위해 다음 명령어를 사용하시기 바랍니다.

Rubygems를 통해 Ruby-Tesseract-OCR 설치

gem install tesseract-ocr 

Github 저장소에서 컴파일된 공유 라이브러리를 다운로드할 수 있습니다.

Ruby를 통해 이미지 및 스캔한 문서에서 텍스트 추출

Ruby-Tesseract-OCR은 소프트웨어 개발자가 단 몇 줄의 Ruby 코드만으로 다양한 유형의 이미지에서 텍스트를 로드하고 추출할 수 있는 매우 강력한 오픈 소스 라이브러리입니다. 라이브러리를 사용하면 이미지, PDF 또는 스캔한 문서에서 텍스트를 쉽게 추출할 수 있습니다. 일반적인 작업 흐름에는 이미지 로드, OCR 매개변수 구성, 텍스트 인식을 위한 OCR 엔진 호출이 포함됩니다. 성공적인 작업을 위해 개발자는 처리하려는 이미지의 경로를 제공하고 text_for 메서드를 호출하여 텍스트를 추출해야 합니다. 마지막으로 결과가 콘솔에 인쇄됩니다. 라이브러리는 페이지 분할 모드, 화이트리스트 문자 등과 같은 OCR 동작을 제어하기 위한 다양한 F구성 옵션을 제공합니다. 다음 예는 소프트웨어 개발자가 JPEG 이미지를 로드하고 Ruby 애플리케이션 내에서 텍스트를 추출하는 방법을 보여줍니다.

Ruby 명령을 사용하여 이미지에서 텍스트를 추출하는 방법

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

e.text_for('test/first.png').strip # => 'ABC'

Ruby를 통해 특정 이미지 영역에서 텍스트 추출

오픈소스 Ruby-Tesseract-OCR 라이브러리는 기본 OCR 기능을 넘어 고급 사용 사례를 위한 추가 기능을 제공합니다. 예를 들어 사용자는 이미지 내에서 관심 영역(ROI)을 지정하여 OCR 분석을 특정 영역으로 제한할 수 있습니다. 이는 복잡한 문서를 처리할 때나 사용자가 특정 섹션에서만 텍스트를 추출해야 할 때 특히 유용합니다. 또한 라이브러리는 인식된 텍스트뿐만 아니라 텍스트 요소의 레이아웃 및 좌표에 대한 정보도 포함하는 HOCR(HTML OCR) 출력을 얻는 방법을 제공합니다. HOCR 출력은 보다 세부적인 데이터가 필요하거나 텍스트 구조에 대한 추가 분석을 수행하려는 경우에 유용합니다.

Ruby 라이브러리를 통해 이미지에서 hOCR을 수행하는 방법

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

puts e.hocr_for('test/first.png')
 한국인