1. Produtos
  2.   Planilha
  3.   Ruby
  4.   Creek
 
  

Biblioteca Ruby Gratuita para Analisar Arquivo Excel XLSX Grande Remotamente

Uma poderosa biblioteca Ruby de código aberto para analisar arquivos Excel XLSX e XLSM grandes remotamente. Suporta análise de arquivos remotos e imagens, mapeamento de cabeçalhos, etc.

O que é a Biblioteca Creek?

No mundo do processamento de dados, lidar com arquivos Excel grandes pode ser uma tarefa assustadora, frequentemente levando a gargalos de desempenho e alto consumo de memória. Apresentamos o Creek, uma poderosa biblioteca Ruby de código aberto projetada para analisar arquivos Excel grandes com eficiência notável. É uma ferramenta eficiente para analisar arquivos Excel grandes. Ela detalha recursos principais como análise por fluxo, suporte a vários tipos de arquivos e opções de uso flexíveis tanto em scripts independentes quanto em aplicações Rails. Ela oferece suporte completo para operações básicas, análise de imagens e manipulação de arquivos remotos, tornando-se um recurso valioso para desenvolvedores que desejam otimizar seus fluxos de trabalho de processamento de dados.

Creek é uma biblioteca robusta, eficiente e focada de código aberto para analisar arquivos Excel .xlsx/.xlsm em Ruby. É um gem Ruby que fornece uma forma rápida e simples de ler e analisar arquivos Excel grandes (XLSX e XLSM). Utiliza análise por fluxo, o que significa que lê o arquivo pedaço por pedaço em vez de carregar todo o arquivo na memória. Essa abordagem torna o Creek incrivelmente eficiente em memória e ideal para aplicações que lidam com grandes conjuntos de dados. Seja trabalhando em um script Ruby independente ou em uma aplicação Rails, o Creek oferece uma experiência de integração perfeita. Se seu projeto envolve planilhas grandes, imagens, metadados ou uploads de arquivos no Rails, o Creek fornece muita funcionalidade necessária com sobrecarga mínima.

Previous Next

Começando com Creek

A forma recomendada de instalar a biblioteca Creek é usando RubyGems. Por favor, use o comando a seguir para uma instalação tranquila.

Instalar Creek via RubyGems

$ gem install Creek  

Analisando Arquivos Excel Grandes via Ruby

A pedra angular da biblioteca de código aberto Creek é sua capacidade de processamento em fluxo. Esse recurso permite processar arquivos Excel grandes sem se preocupar com sobrecarga de memória. Lendo o arquivo em blocos, o Creek garante que seu aplicativo permaneça responsivo e estável, mesmo ao lidar com arquivos contendo centenas de milhares de linhas. O caso de uso mais comum é abrir um arquivo e ler os dados de suas planilhas. Aqui está um exemplo simples que demonstra como desenvolvedores podem analisar um arquivo Excel usando a biblioteca Ruby.

Como analisar arquivos Excel XLSX grandes via biblioteca Ruby?

require 'creek'

# Open the Excel file
creek = Creek::Book.new 'path/to/your/sample.xlsx'

# Get the first sheet
sheet = creek.sheets[0]

# Loop through rows with cell coordinates
sheet.rows.each do |row|
  puts row
  # => {"A1"=>"Content 1", "B1"=>nil, "C1"=>"Content 2"}
end

# Loop through rows without cell coordinates
sheet.simple_rows.each do |row|
  puts row
  # => {"A"=>"Content 1", "B"=>nil, "C"=>"Content 2"}
End

Análise e Extração de Imagens via Biblioteca Ruby

Embora não esteja habilitado por padrão para economizar memória, a biblioteca Creek pode analisar imagens dos seus arquivos Excel. Usando o método with_images, você pode pré-carregar e extrair imagens das células. As imagens são retornadas como um array de objetos Pathname, facilitando seu manuseio. Aqui está um exemplo simples que demonstra como desenvolvedores podem analisar e extrair imagens de uma planilha Excel via Biblioteca Ruby.

Como analisar e extrair imagens de uma planilha Excel via biblioteca Ruby?

require 'creek'

book = Creek::Book.new 'presentation.xlsx'
sheet = book.sheets.first

sheet.with_images.rows.each do |row|
  row.each do |coord, value|
    if value.is_a?(Array)
      # this cell has images
      puts "Images at #{coord}: #{value.inspect}"
    else
      puts "#{coord}: #{value}"
    end
  end
end

# Images at a specific cell
images = sheet.images_at('B2')
if images
  images.each do |path|
    puts "Found image file: #{path}"
  end
else
  puts "No image at B2"
end

Análise de Arquivos Remotos via Biblioteca Ruby

Precisa analisar um arquivo Excel a partir de uma URL? A biblioteca Creek tem a solução. Definindo a opção remote: true, você pode analisar arquivos diretamente de um servidor remoto, eliminando a necessidade de baixá-los primeiro. Você pode analisar arquivos de URLs ou caminhos mesmo que não tenham extensões .xlsx ou .xlsm. A verificação de extensão pode ser ignorada. O argumento check_file_extension pode ser fornecido para contornar a imposição de extensão. Aqui está um exemplo simples para analisar arquivos Excel remotamente via biblioteca Ruby.

Como analisar arquivos Excel XLSX remotamente via biblioteca Ruby?

remote_url = 'http://example.com/sample.xlsx'
creek = Creek::Book.new remote_url, remote: true
# ... process the file

Análise de Arquivos XLSX e XLSM via Ruby

A biblioteca Ruby de código aberto Creek suporta tanto o formato XLSX padrão quanto o formato XLSM habilitado para macro, proporcionando flexibilidade para vários casos de uso. Isso garante que você possa lidar com uma ampla variedade de arquivos Excel sem precisar de várias bibliotecas.

 Português