CentOS HDFS支持多種數據格式,可通過以下方式實現:
- 文件格式支持:HDFS本身支持SequenceFile、TextFile、CSVFile、AvroFile等多種文件格式。在實際應用中,還可通過Hive等工具創建不同格式的表來間接支持更多格式,如使用
STORED AS
子句指定Parquet、ORC等格式。
- 壓縮格式支持:常用壓縮格式有Gzip、BZip2、LZO、Snappy等??稍贖adoop的
hdfs-site.xml
配置文件中添加相應配置參數來啟用,也可在創建表或導入數據時指定壓縮格式。