Bibliotecă Ruby gratuită pentru a analiza fișierul Excel XLSX mare de la distanță

O bibliotecă Ruby puternică, open source, pentru a analiza de la distanță fișierele Excel XLSX și XLSM mari. Acceptă analizarea fișierelor și imaginilor de la distanță, maparea antetelor etc.

Ce este Biblioteca Creek?

În lumea procesării datelor, gestionarea fişierelor Excel mari poate fi o sarcină dificilă, ducând adesea la blocaje de performanţă şi consum ridicat de memorie. Apară Creek, o bibliotecă Ruby open‑source puternică, concepută pentru a parsa fişierele Excel mari cu o eficiență remarcabilă. Este un instrument eficient pentru parsarea fişierelor Excel mari. Ea detaliază funcţii cheie precum parsarea prin flux, suport pentru diverse tipuri de fişiere şi opţiuni flexibile de utilizare atât în scripturile autonome, cât şi în aplicaţiile Rails. Oferă suport complet pentru operaţiunile de bază, parsarea imaginilor şi manipularea fişierelor la distanţă, devenind o resursă valoroasă pentru dezvoltatorii care doresc să îşi optimizeze fluxurile de lucru de procesare a datelor.

Creek este o bibliotecă open‑source robustă, eficientă şi concentrată pentru parsarea fişierelor Excel .xlsx/.xlsm în Ruby. Este o gem Ruby care oferă o metodă rapidă şi simplă de a citi şi parsa fişiere Excel mari (XLSX şi XLSM). Foloseşte parsarea prin flux, ceea ce înseamnă că citeşte fişierul bucată cu bucată în loc să încarce întregul fişier în memorie. Această abordare face ca Creek să fie incredibil de eficient din punct de vedere al memoriei şi ideal pentru aplicaţiile care lucrează cu seturi de date masive. Indiferent dacă lucraţi cu un script Ruby autonom sau cu o aplicație Rails, Creek oferă o experienţă de integrare fără cusur. Dacă proiectul dvs. implică foi de calcul mari, imagini, metadate sau încărcări de fişiere Rails, Creek furnizează multe funcţionalităţi necesare cu un overhead minim.

Previous Next

Începeți cu Creek

Cea mai recomandată metodă de instalare a bibliotecii Creek este prin RubyGems. Vă rugăm să folosiţi comanda de mai jos pentru o instalare fără probleme.

Instalaţi Creek prin RubyGems

$ gem install Creek  

Analizarea fișierelor Excel mari prin Ruby

Piatra de temelie a bibliotecii open source Creek este capacitatea sa de parsare în flux. Această caracteristică permite procesarea fișierelor Excel mari fără să vă faceți griji pentru supraîncărcarea memoriei. Citind fișierul în bucăți, Creek asigură că aplicația dumneavoastră rămâne receptivă și stabilă, chiar și atunci când se lucrează cu fișiere care au sute de mii de rânduri. Cel mai comun caz de utilizare este să deschideți un fișier și să citiți datele din foile de calcul. Iată un exemplu simplu care demonstrează cum dezvoltatorii pot parsa un fișier Excel via biblioteca Ruby.

Cum să parsaţi fişiere Excel XLSX mari prin bibliotecă Ruby?

require 'creek'

# Open the Excel file
creek = Creek::Book.new 'path/to/your/sample.xlsx'

# Get the first sheet
sheet = creek.sheets[0]

# Loop through rows with cell coordinates
sheet.rows.each do |row|
  puts row
  # => {"A1"=>"Content 1", "B1"=>nil, "C1"=>"Content 2"}
end

# Loop through rows without cell coordinates
sheet.simple_rows.each do |row|
  puts row
  # => {"A"=>"Content 1", "B"=>nil, "C"=>"Content 2"}
End

Analizarea și extragerea imaginilor prin bibliotecă Ruby

Deși nu este activată în mod implicit pentru a conserva memoria, biblioteca Creek poate parsa imagini din fișierele dumneavoastră Excel. Folosind metoda with_images, puteți preîncărca și extrage imagini din celule. Imaginile sunt returnate ca un array de obiecte Pathname, făcându-le ușor de manipulat. Iată un exemplu simplu care arată cum dezvoltatorii pot parsa și extrage imagini dintr-un tabel Excel via biblioteca Ruby.

Cum să parsaţi şi să extrageţi imagini dintr-un foaie de lucru Excel prin bibliotecă Ruby?

require 'creek'

book = Creek::Book.new 'presentation.xlsx'
sheet = book.sheets.first

sheet.with_images.rows.each do |row|
  row.each do |coord, value|
    if value.is_a?(Array)
      # this cell has images
      puts "Images at #{coord}: #{value.inspect}"
    else
      puts "#{coord}: #{value}"
    end
  end
end

# Images at a specific cell
images = sheet.images_at('B2')
if images
  images.each do |path|
    puts "Found image file: #{path}"
  end
else
  puts "No image at B2"
end

Analizarea fișierelor de la distanță prin bibliotecă Ruby

Aveți nevoie să parsați un fișier Excel dintr-un URL? Biblioteca Creek vă acoperă. Prin setarea opțiunii remote: true, puteți parsa fișiere direct de pe un server remote, eliminând necesitatea descărcării lor în prealabil. Puteți parsa fișiere din URL-uri sau căi chiar dacă nu au extensiile .xlsx sau .xlsm. Verificarea extensiei poate fi omisă. Argumentul check_file_extension poate fi furnizat pentru a trece peste impunerea extensiei. Iată un exemplu simplu pentru parsarea fișierelor Excel în mod remote via biblioteca Ruby.

Cum să parsaţi fişierul Excel XLSX de la distanţă prin bibliotecă Ruby?

remote_url = 'http://example.com/sample.xlsx'
creek = Creek::Book.new remote_url, remote: true
# ... process the file

Analizarea fișierelor XLSX și XLSM prin Ruby

Biblioteca open source Ruby Creek susține atât formatul standard XLSX, cât și formatul macro-enabled XLSM, oferind flexibilitate pentru diverse cazuri de utilizare. Aceasta garantează că puteți gestiona o gamă largă de fișiere Excel fără a avea nevoie de multiple biblioteci.

 Română