Gratis Ruby‑bibliotek for å analysere store Excel XLSX-filer eksternt
Et kraftig åpen kildekode Ruby-bibliotek for å analysere store Excel XLSX- og XLSM-filer eksternt. Det støtter analyse av eksterne filer og bilder, kartlegging av overskrifter, og så videre.
Hva er Creek-biblioteket?
I databehandlingsverdenen kan håndtering av store Excel-filer være en skremmende oppgave, ofte som fører til ytelsesflaskehalser og høyt minneforbruk. Møt Creek, et kraftig open‑source Ruby-bibliotek designet for å parse store Excel-filer med bemerkelsesverdig effektivitet. Det er et effektivt verktøy for parsing av store Excel-filer. Det beskriver nøkkelfunksjoner som strøm‑parsing, støtte for ulike filtyper, og fleksible bruksalternativer både i frittstående skript og Rails‑applikasjoner. Det gir full støtte for grunnleggende operasjoner, bilde‑parsing, og håndtering av eksterne filer, og er dermed en verdifull ressurs for utviklere som ønsker å optimalisere sine data‑behandlingsarbeidsflyter.
Creek er et robust, effektivt og fokusert open‑source bibliotek for å parse .xlsx/.xlsm Excel‑filer i Ruby. Det er en Ruby‑gem som gir en rask og enkel måte å lese og parse store Excel‑filer (XLSX og XLSM) på. Den benytter strøm‑parsing, noe som betyr at den leser filen bit for bit i stedet for å laste hele filen inn i minnet. Denne tilnærmingen gjør Creek utrolig minne‑effektivt og ideelt for applikasjoner som håndterer massive datasett. Enten du jobber med et frittstående Ruby‑skript eller en Rails‑applikasjon, tilbyr Creek en sømløs integrasjonsopplevelse. Hvis prosjektet ditt involverer store regneark, bilder, metadata eller Rails‑filopplastinger, gir Creek mye nødvendig funksjonalitet med minimal overhead.
Kom i gang med Creek
Den anbefalte måten å installere Creek‑biblioteket på er ved å bruke RubyGems. Vennligst bruk følgende kommando for en smidig installasjon.
Installer Creek via RubyGems
$ gem install Creek Analyse av store Excel-filer via Ruby
Hjørnestenen i det åpne kildekodebiblioteket Creek er dens strøm‑parsing‑evne. Denne funksjonen gjør det mulig å behandle store Excel‑filer uten å bekymre seg for minneoverbelastning. Ved å lese filen i biter sikrer Creek at applikasjonen din forblir responsiv og stabil, selv når du håndterer filer med hundretusenvis av rader. Det vanligste bruksområdet er å åpne en fil og lese data fra regnearkene. Her er et enkelt eksempel som viser hvordan programvareutviklere kan parse en Excel‑fil via Ruby‑biblioteket.
Hvordan parse store Excel XLSX-filer via Ruby-biblioteket?
require 'creek'
# Open the Excel file
creek = Creek::Book.new 'path/to/your/sample.xlsx'
# Get the first sheet
sheet = creek.sheets[0]
# Loop through rows with cell coordinates
sheet.rows.each do |row|
puts row
# => {"A1"=>"Content 1", "B1"=>nil, "C1"=>"Content 2"}
end
# Loop through rows without cell coordinates
sheet.simple_rows.each do |row|
puts row
# => {"A"=>"Content 1", "B"=>nil, "C"=>"Content 2"}
End
Bildeanalyse og -utvinning via Ruby-bibliotek
Selv om den ikke er aktivert som standard for å spare minne, kan Creek‑biblioteket parse bilder fra Excel‑filene dine. Ved å bruke with_images‑metoden kan du forhåndslaste og trekke ut bilder fra celler. Bildene returneres som en matrise av Pathname‑objekter, noe som gjør dem enkle å håndtere. Her er et enkelt eksempel som viser hvordan programvareutviklere kan parse og trekke ut bilder fra et Excel‑regneark via Ruby‑biblioteket.
Hvordan parse og hente ut bilder fra et Excel-regneark via Ruby-biblioteket?
require 'creek'
book = Creek::Book.new 'presentation.xlsx'
sheet = book.sheets.first
sheet.with_images.rows.each do |row|
row.each do |coord, value|
if value.is_a?(Array)
# this cell has images
puts "Images at #{coord}: #{value.inspect}"
else
puts "#{coord}: #{value}"
end
end
end
# Images at a specific cell
images = sheet.images_at('B2')
if images
images.each do |path|
puts "Found image file: #{path}"
end
else
puts "No image at B2"
end
Ekstern filanalyse via Ruby-bibliotek
Trenger du å parse en Excel‑fil fra en URL? Creek‑biblioteket har deg dekket. Ved å sette remote: true‑alternativet kan du parse filer direkte fra en ekstern server, og unngå å måtte laste dem ned først. Du kan parse filer fra URL‑er eller stier selv om de ikke har .xlsx‑ eller .xlsm‑utvidelser. Utvidelsessjekken kan hoppes over. Argumentet check_file_extension kan gis for å omgå påtvinging av utvidelse. Her er et enkelt eksempel på parsing av Excel‑filer eksternt via Ruby‑biblioteket.
Hvordan parse Excel XLSX-fil eksternt via Ruby-biblioteket?
remote_url = 'http://example.com/sample.xlsx'
creek = Creek::Book.new remote_url, remote: true
# ... process the file
Analyse av XLSX- og XLSM-filer via Ruby
Det åpne kildekode‑ruby‑biblioteket Creek støtter både standard XLSX‑ og makro‑aktiverte XLSM‑filformater, noe som gir fleksibilitet for ulike bruksområder. Dette sikrer at du kan håndtere et bredt spekter av Excel‑filer uten å trenge flere biblioteker.