온라인에서 이미지를 텍스트로 변환하는 오픈 소스 Ruby 라이브러리
무료 Ruby OCR(광학 문자 인식) 라이브러리를 사용하면 소프트웨어 개발자가 이미지, PDF 또는 스캔한 문서를 로드하고 읽고 텍스트 또는 검색 가능한 문서로 변환할 수 있습니다.
광학 문자 인식(OCR) 기술은 최근 몇 년 동안 크게 발전하여 다양한 소스에서 데이터 추출을 더 쉽게 자동화할 수 있게 되었습니다. 다양한 영역에서 자동화를 가능하게 하고, 데이터 접근성을 향상시키며, 생산성을 향상시킵니다. 이러한 강력한 도구 중 하나는 개발자에게 OCR 기능을 Ruby 애플리케이션에 통합하기 위한 간단한 솔루션을 제공하는 OcrSpace Ruby 라이브러리입니다. 이 라이브러리는 이미지, 스캔한 문서, PDF 파일에서 텍스트를 추출하는 프로세스를 단순화하므로 편리한 OCR 솔루션을 찾는 개발자에게 탁월한 선택입니다.
OcrSpace Ruby 라이브러리는 간단하고 직관적인 인터페이스를 제공하므로 OCR 기능을 Ruby 애플리케이션에 쉽게 통합할 수 있습니다. 라이브러리에는 다양한 유형의 이미지 로드, 이미지에서 텍스트 추출, 스캔한 문서를 텍스트로 변환, 여러 언어로 작성된 문서에서 텍스트 추출, 저해상도 이미지에서 텍스트 인식, 필기 콘텐츠 작업 등 몇 가지 중요한 기능이 있습니다. , 인식된 텍스트의 좌표 검색, 페이지 번호 감지, 특정 관심 영역 식별 등을 수행합니다.
OcrSpace Ruby 라이브러리는 이미지와 PDF 문서에서 안정적이고 정확한 텍스트 추출을 제공하는 Ocr.Space OCR API를 둘러싼 래퍼입니다. Ruby 개발자를 위해 특별히 제작된 이 라이브러리는 통합 프로세스를 단순화하여 프로그래머가 기본 API의 복잡성을 처리하지 않고도 OCR 기능을 애플리케이션에 신속하게 통합할 수 있도록 합니다. 문서 관리 시스템 구축, 데이터 추출 자동화, 접근성 향상 등 무엇을 하든 OcrSpace Ruby 라이브러리는 OCR 프로세스를 간소화하고 정확한 텍스트 추출 기능으로 애플리케이션을 강화하는 귀중한 도구입니다.
OcrSpace 시작하기
OcrSpace를 설치하는 데 권장되는 방법은 Rubygems를 사용하는 것입니다. 원활한 설치를 위해 다음 명령어를 사용하시기 바랍니다.
Ruby API를 통해 이미지를 URL에서 텍스트로 변환
오픈 소스 OcrSpace 라이브러리에는 다양한 유형의 이미지를 로드하고 몇 줄의 Ruby 코드를 사용하여 이를 텍스트로 변환하는 몇 가지 강력한 기능이 포함되어 있습니다. 라이브러리는 이미지, 스캔한 문서 및 PDF 파일에서 텍스트 추출을 포함하여 다양한 OCR 옵션을 지원합니다. 소프트웨어 개발자가 청구서, 영수증 또는 기타 유형의 문서를 처리해야 하는 경우 OcrSpace Ruby 라이브러리는 이를 효율적으로 처리할 수 있습니다. 다음 예는 소프트웨어 개발자가 Ruby API를 사용하여 URL을 통해 이미지를 텍스트로 변환하는 방법을 보여줍니다.
Ruby API를 통해 URL에서 이미지 변환
result = resource.convert url: "http://bit.ly/2ih9aXt"
puts result
=> #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]
result = resource.clean_convert url: "http://bit.ly/2ih9aXt"
puts result
=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES
Ruby API를 통한 고급 OCR 기능
오픈 소스 OcrSpace 라이브러리에는 Ruby 애플리케이션 내에서 OCR 작업을 처리하는 데 매우 유용하고 고급 기능이 포함되어 있습니다. 저해상도 이미지, 왜곡된 텍스트, 심지어 손으로 쓴 콘텐츠에서도 텍스트를 정확하게 인식하여 다양한 시나리오에서 신뢰할 수 있는 결과를 보장합니다. 텍스트 추출 외에도 라이브러리를 사용하면 개발자가 문서에서 다른 중요한 정보를 추출할 수도 있습니다. 여기에는 인식된 텍스트의 좌표 검색, 페이지 번호 감지, 문서 내 특정 관심 영역 식별이 포함됩니다.
Ruby API를 통해 업로드된 파일에서 텍스트를 추출하는 방법
result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result #Raw result
=> #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}
result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result