Hive Metastore 本身并不直接進行數據清洗,而是存儲和管理數據的元數據。數據清洗通常在數據被加載到 Hive 數據庫之前或之后,通過 Hive SQL 腳本或其他數據處理工具進行。以下是一些在 Hive 環境中進行數據清洗的常見方法:
DROP
填充
插值
刪除
替換
修正
合并
標記