溫馨提示×

hive外部表如何進行數據格式化

小樊
96
2024-12-21 13:43:52
欄目: 大數據

在Hive中,可以使用FROM 'file_path' [OPTIONS]語句來讀取外部文件,并通過ROW FORMATSTORED AS子句來指定數據的格式

  1. CSV格式:
CREATE EXTERNAL TABLE table_name (
    column1 datatype,
    column2 datatype,
    ...
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE;
  1. JSON格式:
CREATE EXTERNAL TABLE table_name (
    column1 datatype,
    column2 datatype,
    ...
)
ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe'
WITH SERDEPROPERTIES (
    "serialization.format" = "1"
)
STORED AS TEXTFILE;
  1. Parquet格式:
CREATE EXTERNAL TABLE table_name (
    column1 datatype,
    column2 datatype,
    ...
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe'
WITH SERDEPROPERTIES (
    "serialization.format" = "1"
)
STORED AS PARQUET;
  1. ORC格式:
CREATE EXTERNAL TABLE table_name (
    column1 datatype,
    column2 datatype,
    ...
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.ql.io.orc.OrcSerde'
WITH SERDEPROPERTIES (
    "serialization.format" = "1"
)
STORED AS ORC;

請將table_name、column1、column2、datatype等替換為實際的表名、列名和數據類型。同時,根據需要修改OPTIONSSERDEPROPERTIES中的參數。

0
亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女