在Hive中,可以使用DISTINCT
關鍵字來實現去重操作。以下是一個簡單的示例:
假設我們有一個名為sales_data
的表,其中包含以下列:id
(唯一標識符),product_id
(產品ID)和quantity
(銷售數量)。
CREATE TABLE sales_data (
id INT,
product_id INT,
quantity INT
);
現在,我們想要查詢每個產品的總銷售數量,但要去除重復的產品ID??梢允褂?code>DISTINCT關鍵字實現這一目標:
SELECT product_id, SUM(quantity) as total_quantity
FROM sales_data
GROUP BY product_id;
這個查詢將返回每個產品ID及其對應的總銷售數量,重復的產品ID將被去除。