在Hive中,可以使用concat_ws
函數來拼接字符串,并使用distinct
關鍵字來實現去重。以下是一個示例:
假設我們有一個名為my_table
的表,其中包含兩個字段:id
(整數)和values
(字符串)。我們希望將values
字段中的所有值拼接在一起,并去除重復的值。
可以使用以下Hive SQL查詢來實現這個目標:
SELECT
id,
concat_ws(',', distinct(values)) AS concatenated_values
FROM
my_table
GROUP BY
id;
這個查詢首先使用distinct
關鍵字去除values
字段中的重復值,然后使用concat_ws
函數將這些值拼接在一起,最后使用GROUP BY
子句按id
字段進行分組。