Gratis Ruby‑bibliotek til at analysere store Excel XLSX-filer på afstand
Et kraftfuldt open source Ruby-bibliotek til at analysere store Excel XLSX‑ og XLSM‑filer på afstand. Det understøtter analyse af fjerne filer og billeder, kortlægning af overskrifter osv.
Hvad er Creek-biblioteket?
I databehandlingsverdenen kan håndtering af store Excel-filer være en udfordrende opgave, som ofte fører til flaskehalse i ydeevnen og højt forbrug af hukommelse. Så er der Creek, et kraftfuldt open‑source Ruby‑bibliotek designet til at parse store Excel‑filer med bemærkelsesværdig effektivitet. Det er et effektivt værktøj til at parse store Excel‑filer. Det beskriver nøglefunktioner som stream‑parsing, understøttelse af forskellige filtyper og fleksible brugsmuligheder både i selvstændige scripts og i Rails‑applikationer. Det leverer fuld understøttelse af grundlæggende operationer, billedparsing og håndtering af eksterne filer, hvilket gør det til en værdifuld ressource for udviklere, der ønsker at optimere deres databehandlings‑workflow.
Creek er et robust, effektivt og fokuseret open‑source bibliotek til at parse .xlsx/.xlsm‑Excel‑filer i Ruby. Det er en Ruby‑gem, som giver en hurtig og simpel måde at læse og parse store Excel‑filer (XLSX og XLSM) på. Det bruger stream‑parsing, hvilket betyder, at filen læses stykke for stykke i stedet for at indlæse hele filen i hukommelsen. Denne tilgang gør Creek ekstremt hukommelses‑effektivt og ideelt for applikationer, der arbejder med massive datasæt. Uanset om du arbejder på et selvstændigt Ruby‑script eller i en Rails‑applikation, tilbyder Creek en problemfri integrationsoplevelse. Hvis dit projekt omfatter store regneark, billeder, metadata eller Rails‑fil‑uploads, giver Creek masser af nødvendig funktionalitet med minimal overhead.
Kom i gang med Creek
Den anbefalede måde at installere Creek‑biblioteket på er via RubyGems. Brug venligst følgende kommando for en glat installation.
Installer Creek via RubyGems
$ gem install Creek Analyse af store Excel‑filer via Ruby
Kernen i den open source Creek-bibliotek er dens stream-parsningsevne. Denne funktion gør det muligt at behandle store Excel-filer uden at bekymre sig om hukommelsesoverbelastning. Ved at læse filen i bidder sikrer Creek, at din applikation forbliver responsiv og stabil, selv når du håndterer filer med hundredtusindvis af rækker. Den mest almindelige anvendelsestilfælde er at åbne en fil og læse data fra dens regneark. Her er et enkelt eksempel, der viser, hvordan softwareudviklere kan parse en Excel-fil via Ruby-biblioteket.
Hvordan parser man store Excel XLSX-filer via Ruby-biblioteket?
require 'creek'
# Open the Excel file
creek = Creek::Book.new 'path/to/your/sample.xlsx'
# Get the first sheet
sheet = creek.sheets[0]
# Loop through rows with cell coordinates
sheet.rows.each do |row|
puts row
# => {"A1"=>"Content 1", "B1"=>nil, "C1"=>"Content 2"}
end
# Loop through rows without cell coordinates
sheet.simple_rows.each do |row|
puts row
# => {"A"=>"Content 1", "B"=>nil, "C"=>"Content 2"}
End
Billedanalyse og udtrækning via Ruby-biblioteket
Selvom den som standard ikke er aktiveret for at spare hukommelse, kan Creek-biblioteket parse billeder fra dine Excel-filer. Ved at bruge with_images-metoden kan du forudindlæse og udtrække billeder fra celler. Billederne returneres som et array af Pathname-objekter, hvilket gør dem nemme at arbejde med. Her er et enkelt eksempel, der viser, hvordan softwareudviklere kan parse og udtrække billeder fra et Excel-regneark via Ruby Library.
Hvordan parser og udtrækker man billeder fra et Excel-regneark via Ruby-biblioteket?
require 'creek'
book = Creek::Book.new 'presentation.xlsx'
sheet = book.sheets.first
sheet.with_images.rows.each do |row|
row.each do |coord, value|
if value.is_a?(Array)
# this cell has images
puts "Images at #{coord}: #{value.inspect}"
else
puts "#{coord}: #{value}"
end
end
end
# Images at a specific cell
images = sheet.images_at('B2')
if images
images.each do |path|
puts "Found image file: #{path}"
end
else
puts "No image at B2"
end
Analyse af fjerne filer via Ruby-biblioteket
Har du brug for at parse en Excel-fil fra en URL? Creek-biblioteket dækker dig. Ved at sætte remote: true-indstillingen kan du parse filer direkte fra en fjernserver, så du ikke behøver at downloade dem først. Du kan parse filer fra URL'er eller stier, selvom de ikke har .xlsx- eller .xlsm-udvidelser. Udvidelseskontrollen kan springes over. Argumentet check_file_extension kan gives for at omgå udvidelsespåkrav. Her er et enkelt eksempel på at parse Excel-filer fjernbetjent via Ruby-biblioteket.
Hvordan parser man Excel XLSX-filen eksternt via Ruby-biblioteket?
remote_url = 'http://example.com/sample.xlsx'
creek = Creek::Book.new remote_url, remote: true
# ... process the file
Analyse af XLSX‑ og XLSM‑filer via Ruby
Det open source Ruby-bibliotek Creek understøtter både standard XLSX- og makroaktiverede XLSM-filformater, hvilket giver fleksibilitet til forskellige anvendelsestilfælde. Dette sikrer, at du kan håndtere et bredt udvalg af Excel-filer uden at skulle bruge flere biblioteker.