/etc/sysctl.conf
):增大文件句柄數(fs.file-max
)、優化TCP連接參數(如net.ipv4.tcp_tw_reuse=1
)。vm.dirty_ratio
(建議50)和vm.dirty_background_ratio
(建議10)。hadoop-env.sh
中設置HADOOP_NAMENODE_OPTS
(如-Xmx4096m
);Hadoop 3.x可手動配置內存分配。dfs.namenode.handler.count
(默認10,建議調整為集群規模的20倍對數)。hdfs-site.xml
中通過dfs.namenode.name.dir
配置多個存儲目錄,提升可靠性。dfs.datanode.data.dir
配置多磁盤目錄,分散數據存儲壓力。dfs.datanode.max.transfer.threads
(默認4096,可增至8192)以提升并發讀寫能力。dfs.blocksize
(如128MB或256MB,大文件建議更大)。core-site.xml
中配置fs.trash.interval
(如60分鐘)和fs.trash.checkpoint.interval
,避免誤刪數據。TestDFSIO
工具測試讀寫性能,分析網絡帶寬與磁盤I/O瓶頸。hdfs diskbalancer
命令平衡節點內磁盤數據分布,避免單盤負載過高。Hadoop Archive
工具),減少NameNode元數據壓力。dfs.hosts
)限制節點訪問,防止惡意節點加入。hdfs dfsadmin -refreshNodes
刷新節點狀態,無需重啟集群。注意事項:優化前需備份數據,測試環境驗證配置有效性,避免影響生產環境穩定性。