Hive中的grouping聚合函數主要包括以下幾種:
- AVG():計算某個數值字段的平均值。
- COUNT():計算某個字段的非空值數量。
- COUNT(DISTINCT column_name):計算某個字段的非空值的不同取值的數量。
- FIRST()和LAST():返回某個字段的第一個值和最后一個值。
- MAX()和MIN():分別返回某個字段的最大值和最小值。
- SUM():計算某個數值字段的總和。
- SUM(DISTINCT column_name):計算某個字段的不同取值的總和。
- GROUP_CONCAT(column_name [SEP sep] [ORDER BY order_by] [LIMIT limit]):將某個字段的所有值按照指定的分隔符連接成一個字符串,并可以指定排序和限制返回的結果數量。
- HAVING:對分組后的結果進行篩選,使用條件表達式來過濾分組。注意,HAVING子句不能單獨使用,必須配合GROUP BY子句一起使用。
這些聚合函數可以與GROUP BY子句一起使用,以便對數據進行分組和匯總。請注意,在使用這些函數時,應確保數據類型與函數參數相匹配,以避免類型錯誤。