Uzaktan Büyük Excel XLSX Dosyasını Ayrıştırmak için Ücretsiz Ruby Kütüphanesi
Uzaktaki Büyük Excel XLSX ve XLSM Dosyalarını Ayrıştırmak için Güçlü Açık Kaynak Ruby Kütüphanesi. Uzaktaki Dosyaları ve Görüntüleri Ayrıştırma, Başlıkları Eşleme ve Daha Fazlasını Destekler.
Creek Kütüphanesi Nedir?
Veri işleme dünyasında, büyük Excel dosyalarını yönetmek zorlu bir görev olabilir ve genellikle performans darboğazları ve yüksek bellek tüketimine yol açar. İşte Creek, büyük Excel dosyalarını olağanüstü verimlilikle ayrıştırmak için tasarlanmış güçlü bir açık kaynak Ruby kütüphanesidir. Büyük Excel dosyalarını ayrıştırmak için verimli bir araçtır. Akış tabanlı ayrıştırma, çeşitli dosya türleri desteği ve bağımsız betikler ile Rails uygulamalarında esnek kullanım seçenekleri gibi temel özellikleri ayrıntılandırır. Temel işlemler, görüntü ayrıştırma ve uzaktaki dosyaların yönetimi için tam destek sağlar, böylece veri işleme iş akışlarını optimize etmek isteyen geliştiriciler için değerli bir kaynak haline gelir.
Creek, Ruby'de .xlsx / .xlsm Excel dosyalarını ayrıştırmak için sağlam, verimli ve odaklanmış bir açık kaynak kütüphanedir. Büyük Excel dosyalarını (XLSX ve XLSM) hızlı ve basit bir şekilde okuyup ayrıştırmak için bir Ruby gem'idir. Akış tabanlı ayrıştırma kullanır; yani dosyayı tümünü belleğe yüklemek yerine parça parça okur. Bu yaklaşım Creek'i son derece bellek verimli kılar ve büyük veri kümeleriyle çalışan uygulamalar için idealdir. Bağımsız bir Ruby betiği ya da bir Rails uygulaması üzerinde çalışıyor olun, Creek sorunsuz bir entegrasyon deneyimi sunar. Projeniz büyük elektronik tablolar, resimler, meta veriler veya Rails dosya yüklemeleri içeriyorsa, Creek minimal ek yükle çok sayıda gerekli işlevsellik sağlar.
Creek ile Başlarken
Creek kütüphanesini kurmanın önerilen yolu RubyGems kullanmaktır. Sorunsuz bir kurulum için lütfen aşağıdaki komutu kullanın.
Creek'i RubyGems üzerinden kurun
$ gem install Creek Ruby ile Büyük Excel Dosyalarını Ayrıştırma
Temel taşını oluşturan Creek açık kaynak kütüphanesi, akış tabanlı ayrıştırma yeteneğidir. Bu özellik, büyük Excel dosyalarını bellek aşırı yüklenmesi endişesi olmadan işleyebilmenizi sağlar. Dosyayı parçalara ayırarak okuyan Creek, uygulamanızın yüz binlerce satır içeren dosyalarla bile duyarlı ve kararlı kalmasını garantiler. En yaygın kullanım senaryosu, bir dosyayı açıp içindeki çalışma sayfalarından veri okumaktır. Aşağıdaki basit örnek, yazılım geliştiricilerin Ruby kütüphanesiyle bir Excel dosyasını nasıl ayrıştırabileceklerini gösterir.
Ruby Kütüphanesi ile Büyük Excel XLSX Dosyalarını Nasıl Ayrıştırılır?
require 'creek'
# Open the Excel file
creek = Creek::Book.new 'path/to/your/sample.xlsx'
# Get the first sheet
sheet = creek.sheets[0]
# Loop through rows with cell coordinates
sheet.rows.each do |row|
puts row
# => {"A1"=>"Content 1", "B1"=>nil, "C1"=>"Content 2"}
end
# Loop through rows without cell coordinates
sheet.simple_rows.each do |row|
puts row
# => {"A"=>"Content 1", "B"=>nil, "C"=>"Content 2"}
End
Ruby Kütüphanesiyle Görüntü Ayrıştırma ve Çıkarma
Belleği korumak için varsayılan olarak etkinleştirilmemiş olmasına rağmen Creek kütüphanesi Excel dosyalarınızdan resim ayrıştırabilir. with_images yöntemiyle hücrelerden resimleri önceden yükleyip çıkarabilirsiniz. Resimler, Pathname nesneleri dizisi olarak döndürülür ve bu da onlarla çalışmayı kolaylaştırır. Aşağıdaki basit örnek, yazılım geliştiricilerin Ruby Kütüphanesi üzerinden bir Excel çalışma sayfasından nasıl resim ayrıştırıp çıkarabileceklerini gösterir.
Ruby Kütüphanesi ile bir Excel Çalışma Sayfasından Resimleri Nasıl Ayrıştırıp Çıkarılır?
require 'creek'
book = Creek::Book.new 'presentation.xlsx'
sheet = book.sheets.first
sheet.with_images.rows.each do |row|
row.each do |coord, value|
if value.is_a?(Array)
# this cell has images
puts "Images at #{coord}: #{value.inspect}"
else
puts "#{coord}: #{value}"
end
end
end
# Images at a specific cell
images = sheet.images_at('B2')
if images
images.each do |path|
puts "Found image file: #{path}"
end
else
puts "No image at B2"
end
Ruby Kütüphanesiyle Uzaktaki Dosya Ayrıştırma
Bir Excel dosyasını bir URL'den ayrıştırmanız mı gerekiyor? Creek kütüphanesi bu konuda da size destek olur. remote: true seçeneğini ayarlayarak dosyaları doğrudan uzak bir sunucudan ayrıştırabilir, önceden indirme zorunluluğunu ortadan kaldırabilirsiniz. .xlsx veya .xlsm uzantısı olmayan URL'lerden veya yollardan da dosyaları ayrıştırabilirsiniz; uzantı kontrolü atlanabilir. check_file_extension argümanı uzantı zorlamasını atlamak için sağlanabilir. Aşağıdaki basit örnek, Ruby kütüphanesi üzerinden Excel dosyalarını uzaktan ayrıştırmayı gösterir.
Ruby Kütüphanesi ile Excel XLSX Dosyasını Uzaktan Nasıl Ayrıştırılır?
remote_url = 'http://example.com/sample.xlsx'
creek = Creek::Book.new remote_url, remote: true
# ... process the file
Ruby ile XLSX ve XLSM Dosyalarını Ayrıştırma
Açık kaynak Ruby kütüphanesi Creek, hem standart XLSX hem de makro etkinleştirilmiş XLSM dosya formatlarını destekler; bu da çeşitli kullanım senaryoları için esneklik sağlar. Böylece birden çok kütüphane kullanmaya gerek kalmadan çok çeşitli Excel dosyalarını yönetebilirsiniz.