Hive支持多種數據壓縮格式,包括Snappy、Gzip、Brotli和LZ4。要在Hive中加載數據進行壓縮,您需要在創建表時指定壓縮類型。以下是如何為Hive表指定壓縮類型的示例:
CREATE TABLE example_table (
id INT,
name STRING
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE
TBLPROPERTIES ('orc.compress'='SNAPPY');
CREATE TABLE example_table (
id INT,
name STRING
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE
TBLPROPERTIES ('gzip'='true');
CREATE TABLE example_table (
id INT,
name STRING
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE
TBLPROPERTIES ('br'='true');
CREATE TABLE example_table (
id INT,
name STRING
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE
TBLPROPERTIES ('lz4'='true');
在這些示例中,我們創建了一個名為example_table
的表,其中包含兩個字段:id
和name
。表的行格式為分隔符分隔,字段之間用逗號分隔。數據存儲格式為文本文件,并指定了相應的壓縮類型。
當您向此表中加載數據時,Hive將自動應用所選壓縮算法對數據進行壓縮。同樣,在查詢數據時,Hive也會自動解壓縮數據。這有助于減少存儲空間和提高查詢性能。