1. Các sản phẩm
  2.   OCR
  3.   Ruby
  4.   OcrSpace
 
  

Thư viện Ruby nguồn mở để chuyển đổi hình ảnh thành văn bản trực tuyến

Thư viện Nhận dạng ký tự quang học (OCR) Ruby miễn phí cho phép các nhà phát triển phần mềm tải, đọc và chuyển đổi hình ảnh, tệp PDF hoặc tài liệu được quét thành văn bản hoặc tài liệu có thể tìm kiếm

Công nghệ Nhận dạng ký tự quang học (OCR) đã có những tiến bộ đáng kể trong những năm gần đây, giúp việc tự động trích xuất dữ liệu từ nhiều nguồn khác nhau trở nên dễ dàng hơn. Công nghệ này cho phép tự động hóa, cải thiện khả năng truy cập dữ liệu và nâng cao năng suất trong nhiều lĩnh vực khác nhau. Một trong những công cụ mạnh mẽ như vậy là thư viện OcrSpace Ruby, cung cấp cho các nhà phát triển giải pháp đơn giản để tích hợp các chức năng OCR vào các ứng dụng Ruby của họ. Thư viện này đơn giản hóa quy trình trích xuất văn bản từ hình ảnh, tài liệu được quét và tệp PDF, khiến nó trở thành lựa chọn tuyệt vời cho các nhà phát triển đang tìm kiếm giải pháp OCR tiện lợi.

Thư viện OcrSpace Ruby cung cấp giao diện đơn giản và trực quan, giúp dễ dàng tích hợp các chức năng OCR vào các ứng dụng Ruby. Thư viện có một số tính năng quan trọng, chẳng hạn như tải nhiều loại hình ảnh, trích xuất văn bản từ hình ảnh, chuyển đổi tài liệu được quét thành văn bản, trích xuất văn bản từ tài liệu được viết bằng nhiều ngôn ngữ, nhận dạng văn bản từ hình ảnh có độ phân giải thấp, làm việc với nội dung viết tay, truy xuất tọa độ của văn bản đã nhận dạng, phát hiện số trang, xác định các khu vực quan tâm cụ thể và nhiều tính năng khác.

Thư viện OcrSpace Ruby là một trình bao bọc xung quanh Ocr.Space OCR API, cung cấp khả năng trích xuất văn bản đáng tin cậy và chính xác từ hình ảnh và tài liệu PDF. Được xây dựng dành riêng cho các nhà phát triển Ruby, thư viện này đơn giản hóa quy trình tích hợp, cho phép các lập trình viên nhanh chóng kết hợp chức năng OCR vào ứng dụng của họ mà không cần giải quyết các vấn đề phức tạp của API cơ bản. Cho dù bạn đang xây dựng hệ thống quản lý tài liệu, tự động trích xuất dữ liệu hay tăng cường khả năng truy cập, thư viện OcrSpace Ruby là một công cụ vô giá giúp hợp lý hóa quy trình OCR và trao quyền cho các ứng dụng của bạn với khả năng trích xuất văn bản chính xác.

Previous Next

Bắt đầu với OcrSpace

Cách được khuyến nghị để cài đặt OcrSpace là sử dụng Rubygems. Vui lòng sử dụng lệnh sau để cài đặt suôn sẻ.

Cài đặt OcrSpace thông qua Rubygems

$ gem install ocr_space 

Bạn có thể tải xuống thư viện chia sẻ đã biên dịch từ kho lưu trữ Github.

Chuyển đổi hình ảnh từ URL sang văn bản thông qua API Ruby

Thư viện OcrSpace nguồn mở đã bao gồm một số tính năng mạnh mẽ để tải nhiều loại hình ảnh khác nhau và chuyển đổi chúng thành văn bản bằng một vài dòng mã Ruby. Thư viện hỗ trợ nhiều tùy chọn OCR khác nhau, bao gồm trích xuất văn bản từ hình ảnh, tài liệu được quét và tệp PDF. Cho dù các nhà phát triển phần mềm cần xử lý hóa đơn, biên lai hay bất kỳ loại tài liệu nào khác, thư viện OcrSpace Ruby đều có thể xử lý hiệu quả. Ví dụ sau đây cho thấy cách các nhà phát triển phần mềm có thể chuyển đổi hình ảnh thành văn bản thông qua URL bằng API Ruby.

Chuyển đổi hình ảnh từ URL thông qua Ruby API

result = resource.convert url: "http://bit.ly/2ih9aXt"

puts result
=>  #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]

result = resource.clean_convert url: "http://bit.ly/2ih9aXt"

puts result

=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES

Khả năng OCR nâng cao thông qua API Ruby

Thư viện OcrSpace nguồn mở đã bao gồm một số tính năng rất hữu ích và nâng cao để xử lý các hoạt động OCR bên trong các ứng dụng Ruby. Thư viện có thể nhận dạng chính xác văn bản từ hình ảnh có độ phân giải thấp, văn bản bị bóp méo và thậm chí cả nội dung viết tay, đảm bảo kết quả đáng tin cậy trong nhiều tình huống khác nhau. Ngoài việc trích xuất văn bản, thư viện còn cho phép các nhà phát triển trích xuất thông tin quan trọng khác từ tài liệu. Điều này bao gồm việc truy xuất tọa độ của văn bản đã nhận dạng, phát hiện số trang và xác định các khu vực quan tâm cụ thể trong tài liệu.

Làm thế nào để trích xuất văn bản từ tệp đã tải lên thông qua Ruby API?

result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result #Raw result

=>  #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}

result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result
 Tiếng Việt