PyExcel
Thư viện Python nguồn mở cho bảng tính
Đọc, tạo, hợp nhất và lọc dữ liệu trong tệp bảng tính CSV, ODS, XLS, XLSX & XLSM thông qua API Python.
PyExcel là một API Python đơn mã nguồn mở hỗ trợ làm việc với một số định dạng bảng tính phổ biến. Nó cho phép các lập trình viên phần mềm đọc, thao tác và ghi dữ liệu ở các định dạng tệp CSV, ODS, XLS, XLSX và XLSM. API tập trung nhiều vào dữ liệu hơn là định dạng tệp. Thư viện giúp các nhà phát triển web xử lý hầu hết các định dạng tệp excel bằng cách cung cấp một giao diện lập trình chung.
Rất dễ dàng lấy hoặc xuất dữ liệu từ các tệp MS Excel. Hầu hết nó yêu cầu mã một lớp để lấy dữ liệu từ các tệp excel. Chỉ có một API để đọc và ghi dữ liệu ở nhiều định dạng tệp excel khác nhau. Một số tính năng quan trọng được API hỗ trợ đầy đủ, chẳng hạn như đọc và cập nhật dữ liệu trong bảng tính, hợp nhất tất cả các tệp excel trong một thư mục, tách sổ làm việc, trích xuất trang tính từ sổ làm việc, hợp nhất các hàng và ô, tạo kiểu cột, thêm hoặc xóa một cột từ một trang tính, lọc dữ liệu và nhiều hơn nữa. API cung cấp danh sách các định dạng tệp được hỗ trợ bởi các plugin bên ngoài. Bạn có thể sử dụng pip để thêm hoặc xóa plugin.
Bắt đầu với PyExcel
Trước hết, bạn cần cài đặt Python 2.6 trở lên trên hệ thống của mình. Cách được khuyến nghị để cài đặt là thông qua pip. Vui lòng sử dụng lệnh sau.
Cài đặt PyExcel thông qua PIP Command
pip install pyexcel
API Python để làm việc với Bảng tính Excel
API PyExcel cho phép các nhà phát triển phần mềm truy cập, đọc, ghi và thao tác dữ liệu ở các định dạng excel khác nhau như CSV, ODS, XLS, XLSX và XLSM. Rất dễ dàng nhập hoặc xuất dữ liệu từ các tệp Excel bằng API PyExcel. Nó hỗ trợ thêm hàng mới vào tệp hiện có, cập nhật hàng trong tệp hiện có, thêm hoặc cập nhật cột vào tệp hiện có, hợp nhất hoặc tách trang tính, tìm kiếm dữ liệu, chuyển đổi tệp excel sang các định dạng khác và hơn thế nữa.
Thêm hàng mới vào tệp bảng tính hiện có thông qua API Python
import pyexcel as pe
sheet = pe.get_sheet(file_name="example.xls")
sheet.row += [12, 11, 10]
sheet.save_as("new_example.xls")
pe.get_sheet(file_name="new_example.xls")
Hợp nhất & Tách một Trang tính Excel
API PyExcel cung cấp cho nhà phát triển khả năng hợp nhất các tệp nằm rải rác trong một thư mục thành một sổ làm việc Excel duy nhất. Mỗi tệp sẽ trở thành một trang tính bên trong sổ làm việc. Nó cũng cung cấp các tính năng để trộn và kết hợp với các định dạng excel khác như XLS, CSV, XLSM và ODS. Nó cũng tạo điều kiện cho bạn chia sổ làm việc thành nhiều tệp. Giả sử bạn có một cuốn sách chứa nhiều trang tính, bằng cách sử dụng thư viện PyExcel mã nguồn mở, bạn có thể tách từng trang thành một tệp excel trang tính duy nhất.
Merge hay chia file Excel qua Python API
//merge two files into one file
from pyexcel.cookbook import merge_two_files
merge_two_files("example.csv", "example.xls", "output.xls")
//Split a workbook into single sheet files
from pyexcel.cookbook import split_a_book
split_a_book("megabook.xls", "output.xls")
import glob
outputfiles = glob.glob("*_output.xls")
for file in sorted(outputfiles):
print(file)
Lọc dữ liệu trong bảng tính
PyExcel API cung cấp các tính năng để các nhà phát triển lọc dữ liệu theo nhu cầu riêng của họ. Giả sử bạn có một lượng lớn dữ liệu và bạn muốn lọc ra một số dữ liệu từ đó. Sử dụng API, bạn có thể dễ dàng làm điều đó. Nó cũng hỗ trợ lọc các hàng hoặc cột trống từ một trang tính. Bạn cũng có thể lưu dữ liệu bộ lọc vào một tệp khác.
Làm thế nào để lọc Ross rỗng khỏi tờ Excel bên trong ứng dụng Python
import pyexcel as pe
sheet = pe.Sheet([[1,2,3],['','',''],['','',''],[1,2,3]])
//define filter
def filter_row(row_index, row):
result = [element for element in row if element != '']
return len(result)==0
// Apply filter
del sheet.row[filter_row]