1. Produkter
  2.   Regneark
  3.   Ruby
  4.   Creek
 
  

Gratis Ruby‑bibliotek til at analysere store Excel XLSX-filer på afstand

Et kraftfuldt open source Ruby-bibliotek til at analysere store Excel XLSX‑ og XLSM‑filer på afstand. Det understøtter analyse af fjerne filer og billeder, kortlægning af overskrifter osv.

Hvad er Creek-biblioteket?

I databehandlingsverdenen kan håndtering af store Excel-filer være en udfordrende opgave, som ofte fører til flaskehalse i ydeevnen og højt forbrug af hukommelse. Så er der Creek, et kraftfuldt open‑source Ruby‑bibliotek designet til at parse store Excel‑filer med bemærkelsesværdig effektivitet. Det er et effektivt værktøj til at parse store Excel‑filer. Det beskriver nøglefunktioner som stream‑parsing, understøttelse af forskellige filtyper og fleksible brugsmuligheder både i selvstændige scripts og i Rails‑applikationer. Det leverer fuld understøttelse af grundlæggende operationer, billedparsing og håndtering af eksterne filer, hvilket gør det til en værdifuld ressource for udviklere, der ønsker at optimere deres databehandlings‑workflow.

Creek er et robust, effektivt og fokuseret open‑source bibliotek til at parse .xlsx/.xlsm‑Excel‑filer i Ruby. Det er en Ruby‑gem, som giver en hurtig og simpel måde at læse og parse store Excel‑filer (XLSX og XLSM) på. Det bruger stream‑parsing, hvilket betyder, at filen læses stykke for stykke i stedet for at indlæse hele filen i hukommelsen. Denne tilgang gør Creek ekstremt hukommelses‑effektivt og ideelt for applikationer, der arbejder med massive datasæt. Uanset om du arbejder på et selvstændigt Ruby‑script eller i en Rails‑applikation, tilbyder Creek en problemfri integrationsoplevelse. Hvis dit projekt omfatter store regneark, billeder, metadata eller Rails‑fil‑uploads, giver Creek masser af nødvendig funktionalitet med minimal overhead.

Previous Next

Kom i gang med Creek

Den anbefalede måde at installere Creek‑biblioteket på er via RubyGems. Brug venligst følgende kommando for en glat installation.

Installer Creek via RubyGems

$ gem install Creek  

Analyse af store Excel‑filer via Ruby

Kernen i den open source Creek-bibliotek er dens stream-parsningsevne. Denne funktion gør det muligt at behandle store Excel-filer uden at bekymre sig om hukommelsesoverbelastning. Ved at læse filen i bidder sikrer Creek, at din applikation forbliver responsiv og stabil, selv når du håndterer filer med hundredtusindvis af rækker. Den mest almindelige anvendelsestilfælde er at åbne en fil og læse data fra dens regneark. Her er et enkelt eksempel, der viser, hvordan softwareudviklere kan parse en Excel-fil via Ruby-biblioteket.

Hvordan parser man store Excel XLSX-filer via Ruby-biblioteket?

require 'creek'

# Open the Excel file
creek = Creek::Book.new 'path/to/your/sample.xlsx'

# Get the first sheet
sheet = creek.sheets[0]

# Loop through rows with cell coordinates
sheet.rows.each do |row|
  puts row
  # => {"A1"=>"Content 1", "B1"=>nil, "C1"=>"Content 2"}
end

# Loop through rows without cell coordinates
sheet.simple_rows.each do |row|
  puts row
  # => {"A"=>"Content 1", "B"=>nil, "C"=>"Content 2"}
End

Billedanalyse og udtrækning via Ruby-biblioteket

Selvom den som standard ikke er aktiveret for at spare hukommelse, kan Creek-biblioteket parse billeder fra dine Excel-filer. Ved at bruge with_images-metoden kan du forudindlæse og udtrække billeder fra celler. Billederne returneres som et array af Pathname-objekter, hvilket gør dem nemme at arbejde med. Her er et enkelt eksempel, der viser, hvordan softwareudviklere kan parse og udtrække billeder fra et Excel-regneark via Ruby Library.

Hvordan parser og udtrækker man billeder fra et Excel-regneark via Ruby-biblioteket?

require 'creek'

book = Creek::Book.new 'presentation.xlsx'
sheet = book.sheets.first

sheet.with_images.rows.each do |row|
  row.each do |coord, value|
    if value.is_a?(Array)
      # this cell has images
      puts "Images at #{coord}: #{value.inspect}"
    else
      puts "#{coord}: #{value}"
    end
  end
end

# Images at a specific cell
images = sheet.images_at('B2')
if images
  images.each do |path|
    puts "Found image file: #{path}"
  end
else
  puts "No image at B2"
end

Analyse af fjerne filer via Ruby-biblioteket

Har du brug for at parse en Excel-fil fra en URL? Creek-biblioteket dækker dig. Ved at sætte remote: true-indstillingen kan du parse filer direkte fra en fjernserver, så du ikke behøver at downloade dem først. Du kan parse filer fra URL'er eller stier, selvom de ikke har .xlsx- eller .xlsm-udvidelser. Udvidelseskontrollen kan springes over. Argumentet check_file_extension kan gives for at omgå udvidelsespåkrav. Her er et enkelt eksempel på at parse Excel-filer fjernbetjent via Ruby-biblioteket.

Hvordan parser man Excel XLSX-filen eksternt via Ruby-biblioteket?

remote_url = 'http://example.com/sample.xlsx'
creek = Creek::Book.new remote_url, remote: true
# ... process the file

Analyse af XLSX‑ og XLSM‑filer via Ruby

Det open source Ruby-bibliotek Creek understøtter både standard XLSX- og makroaktiverede XLSM-filformater, hvilket giver fleksibilitet til forskellige anvendelsestilfælde. Dette sikrer, at du kan håndtere et bredt udvalg af Excel-filer uden at skulle bruge flere biblioteker.

 Dansk