Biblioteca Ruby Gratuita para Analisar Arquivo Excel XLSX Grande Remotamente
Uma poderosa biblioteca Ruby de código aberto para analisar arquivos Excel XLSX e XLSM grandes remotamente. Suporta análise de arquivos remotos e imagens, mapeamento de cabeçalhos, etc.
O que é a Biblioteca Creek?
No mundo do processamento de dados, lidar com arquivos Excel grandes pode ser uma tarefa assustadora, frequentemente levando a gargalos de desempenho e alto consumo de memória. Apresentamos o Creek, uma poderosa biblioteca Ruby de código aberto projetada para analisar arquivos Excel grandes com eficiência notável. É uma ferramenta eficiente para analisar arquivos Excel grandes. Ela detalha recursos principais como análise por fluxo, suporte a vários tipos de arquivos e opções de uso flexíveis tanto em scripts independentes quanto em aplicações Rails. Ela oferece suporte completo para operações básicas, análise de imagens e manipulação de arquivos remotos, tornando-se um recurso valioso para desenvolvedores que desejam otimizar seus fluxos de trabalho de processamento de dados.
Creek é uma biblioteca robusta, eficiente e focada de código aberto para analisar arquivos Excel .xlsx/.xlsm em Ruby. É um gem Ruby que fornece uma forma rápida e simples de ler e analisar arquivos Excel grandes (XLSX e XLSM). Utiliza análise por fluxo, o que significa que lê o arquivo pedaço por pedaço em vez de carregar todo o arquivo na memória. Essa abordagem torna o Creek incrivelmente eficiente em memória e ideal para aplicações que lidam com grandes conjuntos de dados. Seja trabalhando em um script Ruby independente ou em uma aplicação Rails, o Creek oferece uma experiência de integração perfeita. Se seu projeto envolve planilhas grandes, imagens, metadados ou uploads de arquivos no Rails, o Creek fornece muita funcionalidade necessária com sobrecarga mínima.
Começando com Creek
A forma recomendada de instalar a biblioteca Creek é usando RubyGems. Por favor, use o comando a seguir para uma instalação tranquila.
Instalar Creek via RubyGems
$ gem install Creek Analisando Arquivos Excel Grandes via Ruby
A pedra angular da biblioteca de código aberto Creek é sua capacidade de processamento em fluxo. Esse recurso permite processar arquivos Excel grandes sem se preocupar com sobrecarga de memória. Lendo o arquivo em blocos, o Creek garante que seu aplicativo permaneça responsivo e estável, mesmo ao lidar com arquivos contendo centenas de milhares de linhas. O caso de uso mais comum é abrir um arquivo e ler os dados de suas planilhas. Aqui está um exemplo simples que demonstra como desenvolvedores podem analisar um arquivo Excel usando a biblioteca Ruby.
Como analisar arquivos Excel XLSX grandes via biblioteca Ruby?
require 'creek'
# Open the Excel file
creek = Creek::Book.new 'path/to/your/sample.xlsx'
# Get the first sheet
sheet = creek.sheets[0]
# Loop through rows with cell coordinates
sheet.rows.each do |row|
puts row
# => {"A1"=>"Content 1", "B1"=>nil, "C1"=>"Content 2"}
end
# Loop through rows without cell coordinates
sheet.simple_rows.each do |row|
puts row
# => {"A"=>"Content 1", "B"=>nil, "C"=>"Content 2"}
End
Análise e Extração de Imagens via Biblioteca Ruby
Embora não esteja habilitado por padrão para economizar memória, a biblioteca Creek pode analisar imagens dos seus arquivos Excel. Usando o método with_images, você pode pré-carregar e extrair imagens das células. As imagens são retornadas como um array de objetos Pathname, facilitando seu manuseio. Aqui está um exemplo simples que demonstra como desenvolvedores podem analisar e extrair imagens de uma planilha Excel via Biblioteca Ruby.
Como analisar e extrair imagens de uma planilha Excel via biblioteca Ruby?
require 'creek'
book = Creek::Book.new 'presentation.xlsx'
sheet = book.sheets.first
sheet.with_images.rows.each do |row|
row.each do |coord, value|
if value.is_a?(Array)
# this cell has images
puts "Images at #{coord}: #{value.inspect}"
else
puts "#{coord}: #{value}"
end
end
end
# Images at a specific cell
images = sheet.images_at('B2')
if images
images.each do |path|
puts "Found image file: #{path}"
end
else
puts "No image at B2"
end
Análise de Arquivos Remotos via Biblioteca Ruby
Precisa analisar um arquivo Excel a partir de uma URL? A biblioteca Creek tem a solução. Definindo a opção remote: true, você pode analisar arquivos diretamente de um servidor remoto, eliminando a necessidade de baixá-los primeiro. Você pode analisar arquivos de URLs ou caminhos mesmo que não tenham extensões .xlsx ou .xlsm. A verificação de extensão pode ser ignorada. O argumento check_file_extension pode ser fornecido para contornar a imposição de extensão. Aqui está um exemplo simples para analisar arquivos Excel remotamente via biblioteca Ruby.
Como analisar arquivos Excel XLSX remotamente via biblioteca Ruby?
remote_url = 'http://example.com/sample.xlsx'
creek = Creek::Book.new remote_url, remote: true
# ... process the file
Análise de Arquivos XLSX e XLSM via Ruby
A biblioteca Ruby de código aberto Creek suporta tanto o formato XLSX padrão quanto o formato XLSM habilitado para macro, proporcionando flexibilidade para vários casos de uso. Isso garante que você possa lidar com uma ampla variedade de arquivos Excel sem precisar de várias bibliotecas.