在Hive中,可以使用COLLECT_LIST
和COLLECT_SET
函數結合DISTINCT
關鍵字來實現去重。以下是兩種方法的示例:
方法1:使用COLLECT_LIST
和DISTINCT
SELECT
key,
COLLECT_LIST(DISTINCT value) as unique_values
FROM
your_table
GROUP BY
key;
方法2:使用COLLECT_SET
SELECT
key,
COLLECT_SET(value) as unique_values
FROM
your_table
GROUP BY
key;
在這兩個示例中,我們首先根據key
列對數據進行分組。然后,我們使用COLLECT_LIST
或COLLECT_SET
函數來收集每個分組中的唯一值。COLLECT_LIST
會保留所有值(包括重復值),而COLLECT_SET
會自動去除重復值。最后,我們將結果列命名為unique_values
。