Darmowa biblioteka Ruby do zdalnego parsowania dużego pliku Excel XLSX
Potężna otwartoźródłowa biblioteka Ruby do zdalnego parsowania dużych plików Excel XLSX i XLSM. Wspiera parsowanie zdalnych plików i obrazów, mapowanie nagłówków i inne.
Czym jest biblioteka Creek?
W świecie przetwarzania danych obsługa dużych plików Excel może być trudnym zadaniem, często prowadzącym do wąskich gardeł wydajności i wysokiego zużycia pamięci. Oto Creek, potężna otwartoźródłowa biblioteka Ruby zaprojektowana do parsowania dużych plików Excel z niezwykłą wydajnością. Jest to efektywne narzędzie do parsowania dużych plików Excel. Przedstawia kluczowe funkcje, takie jak strumieniowe parsowanie, wsparcie dla różnych typów plików oraz elastyczne opcje użycia zarówno w skryptach samodzielnych, jak i w aplikacjach Rails. Zapewnia pełne wsparcie dla podstawowych operacji, parsowania obrazów i obsługi zdalnych plików, co czyni ją cennym źródłem dla deweloperów chcących zoptymalizować swoje przepływy przetwarzania danych.
Creek jest solidną, wydajną i skoncentrowaną otwartoźródłową biblioteką do parsowania plików Excel .xlsx / .xlsm w Ruby. Jest to gem Ruby, który zapewnia szybki i prosty sposób na odczyt i parsowanie dużych plików Excel (XLSX i XLSM). Wykorzystuje strumieniowe parsowanie, co oznacza, że plik jest czytany kawałek po kawałku, zamiast ładowania całego pliku do pamięci. Takie podejście czyni Creek niezwykle oszczędnym pod względem pamięci i idealnym dla aplikacji pracujących z ogromnymi zestawami danych. Niezależnie od tego, czy pracujesz nad samodzielnym skryptem Ruby, czy aplikacją Rails, Creek oferuje płynne doświadczenie integracji. Jeśli Twój projekt obejmuje duże arkusze kalkulacyjne, obrazy, metadane lub przesyłanie plików w Rails, Creek dostarcza wiele niezbędnych funkcji przy minimalnym narzucie.
Rozpoczęcie pracy z Creek
Zalecany sposób instalacji biblioteki Creek to użycie RubyGems. Proszę użyć następującego polecenia, aby przeprowadzić instalację bez problemów.
Zainstaluj Creek za pomocą RubyGems
$ gem install Creek Parsowanie dużych plików Excel za pomocą Ruby
Kamieniem węgielnym otwartoźródłowej biblioteki Creek jest jej możliwość strumieniowego parsowania. Ta funkcja pozwala przetwarzać duże pliki Excel bez obaw o przepełnienie pamięci. Czytając plik w kawałkach, Creek zapewnia, że aplikacja pozostaje responsywna i stabilna, nawet przy obsłudze plików z setkami tysięcy wierszy. Najczęstszym przypadkiem użycia jest otwarcie pliku i odczyt danych z jego arkuszy. Oto prosty przykład, który pokazuje, jak programiści mogą parsować plik Excel za pomocą biblioteki Ruby.
Jak parsować duże pliki Excel XLSX za pomocą biblioteki Ruby?
require 'creek'
# Open the Excel file
creek = Creek::Book.new 'path/to/your/sample.xlsx'
# Get the first sheet
sheet = creek.sheets[0]
# Loop through rows with cell coordinates
sheet.rows.each do |row|
puts row
# => {"A1"=>"Content 1", "B1"=>nil, "C1"=>"Content 2"}
end
# Loop through rows without cell coordinates
sheet.simple_rows.each do |row|
puts row
# => {"A"=>"Content 1", "B"=>nil, "C"=>"Content 2"}
End
Parsowanie i wyodrębnianie obrazów za pomocą biblioteki Ruby
Choć domyślnie wyłączona w celu oszczędzania pamięci, biblioteka Creek potrafi parsować obrazy z plików Excel. Korzystając z metody with_images, można wstępnie załadować i wyodrębnić obrazy z komórek. Obrazy są zwracane jako tablica obiektów Pathname, co ułatwia ich obsługę. Oto prosty przykład, który pokazuje, jak programiści mogą parsować i wyodrębniać obrazy z arkusza kalkulacyjnego Excel za pomocą biblioteki Ruby.
Jak parsować i wyodrębniać obrazy z arkusza Excel za pomocą biblioteki Ruby?
require 'creek'
book = Creek::Book.new 'presentation.xlsx'
sheet = book.sheets.first
sheet.with_images.rows.each do |row|
row.each do |coord, value|
if value.is_a?(Array)
# this cell has images
puts "Images at #{coord}: #{value.inspect}"
else
puts "#{coord}: #{value}"
end
end
end
# Images at a specific cell
images = sheet.images_at('B2')
if images
images.each do |path|
puts "Found image file: #{path}"
end
else
puts "No image at B2"
end
Zdalne parsowanie plików za pomocą biblioteki Ruby
Potrzebujesz parsować plik Excel z adresu URL? Biblioteka Creek ma to załatwione. Ustawiając opcję remote: true, możesz parsować pliki bezpośrednio z serwera zdalnego, eliminując konieczność ich wcześniejszego pobierania. Możesz parsować pliki z URL‑ów lub ścieżek, nawet jeśli nie mają rozszerzeń .xlsx lub .xlsm. Sprawdzenie rozszerzenia może zostać pominięte. Argument check_file_extension można podać, aby pominąć wymuszanie rozszerzenia. Oto prosty przykład parsowania plików Excel zdalnie za pomocą biblioteki Ruby.
Jak parsować plik Excel XLSX zdalnie za pomocą biblioteki Ruby?
remote_url = 'http://example.com/sample.xlsx'
creek = Creek::Book.new remote_url, remote: true
# ... process the file
Parsowanie plików XLSX i XLSM za pomocą Ruby
Otwarta biblioteka Ruby Creek obsługuje zarówno standardowy format XLSX, jak i format XLSM z włączonymi makrami, zapewniając elastyczność dla różnych przypadków użycia. Dzięki temu możesz obsługiwać szeroką gamę plików Excel bez potrzeby używania wielu bibliotek.