這篇文章主要介紹了怎么使用Python+Pandas實現數據透視表的相關知識,內容詳細易懂,操作簡單快捷,具有一定借鑒價值,相信大家閱讀完這篇怎么使用Python+Pandas實現數據透視表文章都會有所收獲,下面我們一起來看看吧。
首先導入演示的數據集。
import pandas as pd
df = pd.read_csv('銷售目標.csv')
df.head()

主要參數:
data:待操作的 DataFrame
values:被聚合操作的列,可選項
index:行分組鍵,作為結果 DataFrame 的行索引
columns:列分組鍵,作為結果 DataFrame 的列索引
aggfunc:聚合函數/函數列表,默認 numpy.mean 這里要注意如果 aggfunc 中存在函數列表,則返回的 DataFrame 中會顯示函數名稱
fill_value:默認 None,可設定缺省值
dropna:默認 True,如果列的所有值都是 NaN,將被刪除;False 則保留
margins:默認 False,設置為 True 可以添加行/列的總計
margins_name:默認顯示 'ALL',當 margins = True 時,可以設定 margins 行/列的名稱
使用pivot_table時必須要指定index,因為計算時要根據index進行聚合。
pd.pivot_table(df.head(20), index='訂單日期', aggfunc=np.sum)

通過指定value來選擇被聚合的列。
pd.pivot_table(df.head(20), values='銷售目標', index='訂單日期', aggfunc=np.sum)

當只指定index進行聚合時,其實用groupby可以實現同樣的效果。
df.head(20).groupby(['訂單日期'])['銷售目標'].sum().reset_index()
添加columns參數,對列分組。
pd.pivot_table(df.head(10), values='銷售目標', index=['訂單日期', '類別'], columns='細分', aggfunc=np.sum)

對于上面結果中的空值,使用fill_value參數統一填充為0
pd.pivot_table(df.head(10), values='銷售目標', index=['訂單日期', '類別'], columns=['細分'], aggfunc=np.sum, fill_value=0)

現在按年份來統計銷售數據,注意此時的aggfunc參數,當參數值包含列表時,在結果DataFrame中就會顯示函數名稱。
pd.pivot_table(df, values='銷售目標', index=['年份', '類別'], columns='細分', aggfunc=[np.sum])

如果需要添加合計列,只需指定margins=True即可,同時根據需要指定合計名稱。
pd.pivot_table(df, values='銷售目標', index=['年份', '類別'], columns='細分', aggfunc=np.sum, margins=True, margins_name='合計')

當然與groupby類似,對于計算函數我們可以同時指定多種方式。
pd.pivot_table(df,
values='銷售目標',
index=['年份', '類別'],
columns=['細分'],
aggfunc={'銷售目標': [max, np.sum]},
fill_value=0)
關于“怎么使用Python+Pandas實現數據透視表”這篇文章的內容就介紹到這里,感謝各位的閱讀!相信大家對“怎么使用Python+Pandas實現數據透視表”知識都有一定的了解,大家如果還想學習更多知識,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。