以下是在Ubuntu上高效配置HDFS的關鍵步驟和技巧:
# 修改hdfs-site.xml
<property>
<name>dfs.blocksize</name>
<value>134217728</value> <!-- 128MB -->
</property>
<property>
<name>dfs.replication</name>
<value>2</value> <!-- 非關鍵數據可降低至2 -->
</property>
dfs.namenode.handler.count,默認10,可調整為30~50)。hadoop archive工具),減少NameNode元數據壓力。# 啟用Map輸出壓縮
<property>
<name>mapreduce.map.output.compress</name>
<value>true</value>
</property>
<property>
<name>mapreduce.map.output.compress.codec</name>
<value>org.apache.hadoop.io.compress.SnappyCodec</value>
</property>
/etc/sysctl.conf,如增大vm.swappiness(建議10~30)以減少內存交換。參考來源: