在Hive中,可以使用LOAD DATA
語句將外部文件加載到表中。為了對數據進行格式化,可以在LOAD DATA
語句中使用ROW FORMAT
和STORED AS
子句。以下是一個示例:
employees.txt
的文本文件,其內容如下:John,25,Male
Alice,30,Female
Bob,22,Male
每行表示一個員工的信息,包含姓名、年齡和性別。
CREATE TABLE employees (
name STRING,
age INT,
gender STRING
);
LOAD DATA
語句將employees.txt
文件加載到employees
表中,并對數據進行格式化。在這個例子中,我們將使用逗號作為字段分隔符(默認值),并將每行的第一個字段作為name
,第二個字段作為age
,第三個字段作為gender
:LOAD DATA INPATH '/path/to/employees.txt'
INTO TABLE employees
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE;
employees
表,查看加載的數據:SELECT * FROM employees;
輸出結果:
name age gender
John 25 Male
Alice 30 Female
Bob 22 Male
通過這種方式,你可以根據需要對加載到Hive表中的數據進行格式化。