溫馨提示×

如何在DataFrame中實現SQL的分組統計

sql

小樊

117

2024-09-09 22:32:34

欄目: 云計算

要在Python的pandas庫中實現類似于SQL的分組統計，可以使用groupby()和agg()函數

首先，我們需要導入pandas庫并創建一個DataFrame。這里是一個簡單的例子：

import pandas as pd

data = {'Category': ['A', 'B', 'A', 'A', 'B', 'A', 'B', 'B'],
        'Value': [10, 20, 30, 40, 10, 30, 20, 40]}

df = pd.DataFrame(data)

上述代碼將創建一個如下所示的DataFrame：

  Category  Value
0        A     10
1        B     20
2        A     30
3        A     40
4        B     10
5        A     30
6        B     20
7        B     40

現在，我們可以使用groupby()和agg()函數對Category列進行分組統計，并計算Value列的總和、平均值、最小值和最大值。

result = df.groupby('Category')['Value'].agg(['sum', 'mean', 'min', 'max'])

result DataFrame將如下所示：

         sum  mean  min  max
Category                  
A          110  27.5   10   40
B           90  22.5   10   40

在這個例子中，我們使用了agg()函數來指定我們想要對Value列執行的統計操作。你可以根據需要添加或刪除統計操作。其他常用的統計操作包括'count'、'median'、'var'和'std'等。

0 贊

0 踩

最新問答

相關問答

相關標簽

產品服務

地區劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女