這篇文章將為大家詳細講解有關深入淺析Python Excel模塊中openpyxl的原理,文章內容質量較高,因此小編分享給大家做個參考,希望大家閱讀完這篇文章后對相關知識有一定的了解。
openpyxl 介紹
openpyxl 是一個直接可用于讀寫 xlsx 、xlsm、xltx、xltm 文件的 Python 內置庫,借助它可以利用 Python 語法對本地 xlsx 文件進行自動化批量操作
先說一下安裝部分,如果小伙伴們用 Anaconda 作為 Python 環境的話,openpyxl 無需安裝可直接使用;需要安裝的話方法也非常簡單 pip 工具一行命令即可
pip install openpyxl
xlsx 文件屬性
在對 Excel 表格處理之前,需要了解一下 xlsx 文件的幾個名詞解釋及構造
1,Workbook 指的是神什么?
Workbook 名叫工作薄,可以代指一個 xlsx 文件;
2, sheet、cell、row 、col 分別指的是什么?
關于問題2 ,可參考下圖(見注釋)

openpyxl 基本命令操作
1, 創建 一個空的 workbook
from openpypl import Wrokbook
from openpyxl.utils import get_column_letterwb = Workbook()
ws1 = wb.active
一個 Workbook 默認至少含有一個 worksheet ,通過命令 Workbook.active 來獲取當前第一個 sheet(也就是第一個 sheet);
2,創建新的 worksheet
ws1 = wb.create_sheet("Mysheet") # insert at the end (default)
ws2 = wb.create_sheet("Mysheet", 0) # insert at first position
# or
ws3 = wb.create_sheet("Mysheet", -1) # insert at the penultimate position
可通過 create_sheet() 命令創建新的 worksheet , create_sheet 默認有兩個參數 name、index;
3,更改 sheet 的名字
一行代碼即可
ws.title = 'New Title'
4,更改 sheet 上 tab 背景顏色
ws.sheet_properties.tabColor = "1072BA"
通過修改 Wroksheet.sheet_properties.tabColor 參數即可,需要注意的是這里只接收 RRGGBB 顏色代碼;
關于不清楚 sheet tab 背景顏色不清楚是什么的小伙伴,可參考下圖;

5, 返回 Workbook 中所有 sheet 的名字
通過 Workbook.sheetname 命令即可查看
>>> print(wb.sheetnames)
['Sheet2', 'New Title', 'Sheet1']# 或者用迭代方法
>>> for sheet in wb:
... print(sheet.title)
6,將現有的 worksheets 復制新創建的 workbook 中
可通過 Workbook.copy_worksheet()函數方法
# 將 source 中的worksheet復制到 target 中去
source = wb.active
target = wb.copy_worksheet(source)
需要注意的是,當 workbook 為只讀或 只寫模式時不可復制;另外只有 cells(值,樣式,超鏈接、注釋) 和 特定的 worksheet 屬性(維度、格式、屬性)可以復制,其他的一些 workbook / worksheet 屬性不可復制( Images Charts 等)
7,獲取某個 cell 的數據
成功創建完 Workbook、Worksheet 之后,接下來就可以修改 cell(單元格中的內容,Cells 可以通過 worksheet 中特有關鍵詞來獲取
>>> c = ws['A4'] # 獲取第4行列名為A 單元格中的值
通過賦值命令對其修改
ws['A4'] = 4
openpyxl 中有一個函數 Worksheet.cell() 可修改單元格中的數據,可定位到具體行、具體列進行更改,
d = ws.cell(row = 4,columns = 2,value = 10)
例如
>>> for x in range(1,101):
... for y in range(1,101):
... ws.cell(row=x, column=y)
8,獲取多個單元格
8.1 , openpyxl 也可以進行切片操作,來獲取多個單元格
>>> cell_range = ws['A1':'C2']
8.2, worksheet 中多行多列數據獲取方式相似
>>> colC = ws['C']
>>> col_range = ws['C:D']
>>> row10 = ws[10]
>>> row_range = ws[5:10]
8.3,Worksheet.iter_row() 來獲取 sheet 中行列范圍,再利用循環迭代獲取每一個單元格數據
>>> for row in ws.iter_rows(min_row=1, max_col=3, max_row=2):
... for cell in row:
... print(cell)
<Cell Sheet1.A1>
<Cell Sheet1.B1>
<Cell Sheet1.C1>
<Cell Sheet1.A2>
<Cell Sheet1.B2>
<Cell Sheet1.C2>
8.4,Worksheet.iter_cols() 也可以實現同樣功能
>>> for col in ws.iter_cols(min_row=1, max_col=3, max_row=2):
... for cell in col:
... print(cell)
<Cell Sheet1.A1>
<Cell Sheet1.A2>
<Cell Sheet1.B1>
<Cell Sheet1.B2>
<Cell Sheet1.C1>
<Cell Sheet1.C2>
需要注意的時在 read-only 模式中,Worksheet,iter_cols() 方法不能使用
9,只查看 cell 中的 value
9.1,只查看 worksheet 中的 value 時,可通過 Worksheet.values 屬性,該屬性將迭代 worksheet 中所有行,但返回的僅僅是 cell values
for row in ws.values:
for value in row:
print(value)
9.2,通過 Worksheet.iter_rows() 和 Worksheet.iter_cols() 也可以實現,在函數中加入一個參數 values_only = True 即可返回 cell 的值
>>> for row in ws.iter_rows(min_row=1, max_col=3, max_row=2, values_only=True):
... print(row)(None, None, None)
(None, None, None)
10,讀寫文件操作
10,excel 文件加載
openpyxl.load_workbook() 函數來打開一個指定本地存儲的 xlsx 文件
>>> from openpyxl import load_workbook
>>> wb2 = load_workbook('test.xlsx')
>>> print wb2.sheetnames
['Sheet2', 'New Title', 'Sheet1']
10.2,excel 文件存儲
Workbook 修改成功后,后創建完成之后,通過Workbook.save(path) 命令即可保存至本地磁盤
>>> wb = Workbook()
>>> wb.save('balances.xlsx')
關于深入淺析Python Excel模塊中openpyxl的原理就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。