ספריית Ruby חינמית לפענוח קובץ Excel XLSX גדול מרחוק

ספריית Ruby בקוד פתוח וחזקה לפענוח קבצי Excel XLSX ו‑XLSM גדולים מרחוק. היא תומכת בפענוח קבצים מרוחקים ובתמונות, מיפוי כותרות ועוד.

מהי ספריית Creek?

בעולם של עיבוד נתונים, טיפול בקובצי Excel גדולים יכול להוות משימה מתישה, לעיתים גורמת לחסימות בביצועים ולצריכת זיכרון גבוהה. כאן נכנס Creek, ספריית Ruby קוד פתוח חזקה שנועדה לנתח קובצי Excel גדולים ביעילות מרשימה. זהו כלי יעיל לניתוח קובצי Excel גדולים. הוא מפרט תכונות מרכזיות כגון ניתוח זרימה, תמיכה בסוגי קבצים שונים, ואפשרויות שימוש גמישות הן בתסריטים עצמאיים והן ביישומי Rails. הספרייה מציעה תמיכה מלאה בפעולות בסיסיות, ניתוח תמונות, וטיפול בקבצים מרחוק, מה שהופך אותה למשאב יקר ערך למפתחים המבקשים לייעל את זרימות העבודה של עיבוד הנתונים שלהם.

Creek היא ספרייה פתוחה חזקה, יעילה וממוקדת לניתוח קובצי Excel .xlsx / .xlsm ב‑Ruby. היא ג'ם של Ruby המספק דרך מהירה ופשוטה לקרוא ולנתח קובצי Excel גדולים (XLSX ו‑XLSM). היא משתמשת בניתוח זרימה, כלומר קוראת את הקובץ חלק אחר חלק במקום לטעון את כל הקובץ בזיכרון. גישה זו מגדילה משמעותית את יעילות השימוש בזיכרון של Creek ומופעלת באופן אידיאלי עבור יישומים המתמודדים עם קבוצות נתונים מסיביות. בין אם אתם עובדים על תסריט Ruby עצמאי או על יישום Rails, Creek מציעה חוויית אינטגרציה חלקה. אם הפרויקט שלכם כולל גיליונות אלקטרוניים גדולים, תמונות, מטה‑נתונים או העלאות קבצים ב‑Rails, Creek מספקת הרבה פונקציונליות נדרשת עם עומס מינימלי.

Previous Next

התחלת עבודה עם Creek

הדרך המומלצת להתקנת ספריית Creek היא באמצעות RubyGems. יש להשתמש בפקודה הבאה להתקנה חלקה.

התקנת Creek באמצעות RubyGems

$ gem install Creek  

פענוח קבצי Excel גדולים באמצעות Ruby

האבני הפינה של ספריית Creek בקוד פתוח היא יכולת ניתוח הזרם שלה. תכונה זו מאפשרת לך לעבד קבצי Excel גדולים מבלי לדאוג לעומסי זיכרון. על ידי קריאת הקובץ בחלקים, Creek מבטיחה שהיישום שלך יישאר תגובתי ויציב, גם כאשר מטפל בקבצים עם מאות אלפי שורות. המקרה השימושי ביותר הוא פתיחת קובץ וקריאת נתונים מהגיליונות שלו. הנה דוגמה פשוטה שמדגים כיצד מפתחים יכולים לנתח קובץ Excel באמצעות ספריית Ruby.

כיצד לנתח קבצי Excel XLSX גדולים באמצעות ספריית Ruby?

require 'creek'

# Open the Excel file
creek = Creek::Book.new 'path/to/your/sample.xlsx'

# Get the first sheet
sheet = creek.sheets[0]

# Loop through rows with cell coordinates
sheet.rows.each do |row|
  puts row
  # => {"A1"=>"Content 1", "B1"=>nil, "C1"=>"Content 2"}
end

# Loop through rows without cell coordinates
sheet.simple_rows.each do |row|
  puts row
  # => {"A"=>"Content 1", "B"=>nil, "C"=>"Content 2"}
End

פענוח ותיקון תמונות באמצעות ספריית Ruby

למרות שלא מופעל כברירת מחדל כדי לחסוך בזיכרון, ספריית Creek יכולה לנתח תמונות מקבצי Excel שלך. על ידי שימוש בשיטה with_images, ניתן לטעון מראש ולחלץ תמונות מתאים לתאים. התמונות מוחזרות כמערך של אובייקטים מסוג Pathname, מה שמקל על השימוש בהן. הנה דוגמה פשוטה שממחישה כיצד מפתחים יכולים לנתח ולחלץ תמונות מגיליון Excel באמצעות ספריית Ruby.

כיצד לנתח ולחלץ תמונות מגיליון Excel באמצעות ספריית Ruby?

require 'creek'

book = Creek::Book.new 'presentation.xlsx'
sheet = book.sheets.first

sheet.with_images.rows.each do |row|
  row.each do |coord, value|
    if value.is_a?(Array)
      # this cell has images
      puts "Images at #{coord}: #{value.inspect}"
    else
      puts "#{coord}: #{value}"
    end
  end
end

# Images at a specific cell
images = sheet.images_at('B2')
if images
  images.each do |path|
    puts "Found image file: #{path}"
  end
else
  puts "No image at B2"
end

פענוח קובץ מרוחק באמצעות ספריית Ruby

צריך לנתח קובץ Excel מ-URL? ספריית Creek מכסה אותך. על ידי הגדרת האפשרות remote: true, ניתן לנתח קבצים ישירות משרת מרוחק, ללא צורך להוריד אותם תחילה. ניתן לנתח קבצים מכתובות URL או נתיבים גם אם הם אינם בעלי סיומת .xlsx או .xlsm. ניתן לדלג על בדיקת הסיומת. ניתן להעביר את הפרמטר check_file_extension כדי לעקוף אכיפת הסיומת. הנה דוגמה פשוטה לניתוח קבצי Excel מרחוק באמצעות ספריית Ruby.

כיצד לנתח קובץ Excel XLSX מרחוק באמצעות ספריית Ruby?

remote_url = 'http://example.com/sample.xlsx'
creek = Creek::Book.new remote_url, remote: true
# ... process the file

פענוח קבצי XLSX ו‑XLSM באמצעות Ruby

ספריית Ruby בקוד פתוח Creek תומכת הן בפורמט XLSX הסטנדרטי והן בפורמט המקרו-מאופשר XLSM, מה שמספק גמישות למגוון מקרים. זה מבטיח שניתן לטפל במגוון רחב של קבצי Excel מבלי להזדקק למספר ספריות.

 עִברִית