Free Ruby Librry to Parse Large Excel XLSX File Remotely
A Powerful Open Source Ruby Library to Parse Large Excel XLSX and XLSM Files Remotely. It Supports Parsing Remote Files and Images, Mapping Headers, and So on.
What is Creek Library?
Im Bereich der Datenverarbeitung kann die Verarbeitung großer Excel-Dateien eine anspruchsvolle Aufgabe sein, die häufig zu Leistungsengpässen und hohem Speicherverbrauch führt. Hier kommt Creek ins Spiel, eine leistungsstarke Open‑Source‑Ruby‑Bibliothek, die zum effizienten Parsen großer Excel‑Dateien entwickelt wurde. Sie ist ein effizientes Werkzeug zum Parsen großer Excel‑Dateien. Sie beschreibt wichtige Merkmale wie Stream‑Parsing, Unterstützung verschiedener Dateitypen und flexible Nutzungsmöglichkeiten sowohl in eigenständigen Skripten als auch in Rails‑Anwendungen. Sie bietet vollständige Unterstützung für Grundoperationen, Bild‑Parsing und das Verarbeiten von Remote‑Dateien, wodurch sie für Entwickler, die ihre Datenverarbeitungs‑Workflows optimieren möchten, ein wertvolles Hilfsmittel darstellt.
Creek ist eine robuste, effiziente und fokussierte Open‑Source‑Bibliothek zum Parsen von .xlsx‑/ .xlsm‑Excel‑Dateien in Ruby. Es handelt sich um ein Ruby‑Gem, das eine schnelle und einfache Möglichkeit bietet, große Excel‑Dateien (XLSX und XLSM) zu lesen und zu parsen. Es nutzt Stream‑Parsing, das bedeutet, dass die Datei Stück für Stück gelesen wird, anstatt die gesamte Datei vollständig in den Speicher zu laden. Dieser Ansatz macht Creek äußerst speichereffizient und ideal für Anwendungen, die mit riesigen Datensätzen arbeiten. Egal, ob Sie ein eigenständiges Ruby‑Skript oder eine Rails‑Anwendung verwenden, Creek bietet ein nahtloses Integrationserlebnis. Wenn Ihr Projekt große Tabellenkalkulationen, Bilder, Metadaten oder Rails‑Dateiuploads umfasst, liefert Creek viel benötigte Funktionalität bei minimalem Overhead.
Getting Started with Creek
Die empfohlene Methode, um die Creek‑Bibliothek zu installieren, ist die Verwendung von RubyGems. Bitte verwenden Sie den folgenden Befehl für eine reibungslose Installation.
Creek über RubyGems installieren
$ gem install Creek Parsing Large Excel Files via Ruby
Hjørnestenen i den åbne kilde Creek-biblioteket er dens stream-parsing evne. Denne funktion giver dig mulighed for at behandle store Excel-filer uden at bekymre dig om hukommelsesoverbelastning. Ved at læse filen i bidder sikrer Creek, at din applikation forbliver responsiv og stabil, selv når du håndterer filer med hundredtusinder af rækker. Det mest almindelige anvendelsestilfælde er at åbne en fil og læse data fra dens regneark. Her er et enkelt eksempel, der demonstrerer, hvordan softwareudviklere kan parse en Excel-fil via Ruby-biblioteket.
Wie man große Excel XLSX-Dateien über eine Ruby-Bibliothek analysiert?
require 'creek'
# Open the Excel file
creek = Creek::Book.new 'path/to/your/sample.xlsx'
# Get the first sheet
sheet = creek.sheets[0]
# Loop through rows with cell coordinates
sheet.rows.each do |row|
puts row
# => {"A1"=>"Content 1", "B1"=>nil, "C1"=>"Content 2"}
end
# Loop through rows without cell coordinates
sheet.simple_rows.each do |row|
puts row
# => {"A"=>"Content 1", "B"=>nil, "C"=>"Content 2"}
End
Image Parsing & Extracting via Ruby Library
Selvom den ikke er aktiveret som standard for at spare hukommelse, kan Creek-biblioteket parse billeder fra dine Excel-filer. Ved at bruge metoden with_images kan du forudindlæse og udtrække billeder fra celler. Billederne returneres som et array af Pathname-objekter, hvilket gør dem lette at arbejde med. Her er et enkelt eksempel, der demonstrerer, hvordan softwareudviklere kan parse og udtrække billeder fra et Excel-regneark via Ruby-biblioteket.
Wie man Bilder aus einem Excel-Arbeitsblatt über eine Ruby-Bibliothek analysiert und extrahiert?
require 'creek'
book = Creek::Book.new 'presentation.xlsx'
sheet = book.sheets.first
sheet.with_images.rows.each do |row|
row.each do |coord, value|
if value.is_a?(Array)
# this cell has images
puts "Images at #{coord}: #{value.inspect}"
else
puts "#{coord}: #{value}"
end
end
end
# Images at a specific cell
images = sheet.images_at('B2')
if images
images.each do |path|
puts "Found image file: #{path}"
end
else
puts "No image at B2"
end
Remote File Parsing via Ruby Library
Har du brug for at parse en Excel-fil fra en URL? Creek-biblioteket dækker dig. Ved at indstille remote: true-flaget kan du parse filer direkte fra en fjernserver, så du ikke behøver at downloade dem først. Du kan parse filer fra URL'er eller stier, selvom de ikke har .xlsx- eller .xlsm-udvidelser. Udvidelseskontrollen kan springes over. Argumentet check_file_extension kan gives for at omgå udvidelseskravet. Her er et enkelt eksempel på at parse Excel-filer fjernbetjent via Ruby-biblioteket.
Wie man Excel XLSX-Dateien remote über eine Ruby-Bibliothek analysiert?
remote_url = 'http://example.com/sample.xlsx'
creek = Creek::Book.new remote_url, remote: true
# ... process the file
XLSX and XLSM Files Parsing via Ruby
Det åbne kilde Ruby-bibliotek Creek understøtter både standard XLSX og de makroaktiverede XLSM filformater, hvilket giver fleksibilitet til forskellige brugsscenarier. Det sikrer, at du kan håndtere et bredt udvalg af Excel-filer uden at skulle bruge flere biblioteker.