/etc/sysctl.conf):增大文件句柄數(fs.file-max)、優化TCP連接參數(如net.ipv4.tcp_tw_reuse=1)。vm.dirty_ratio(建議50)和vm.dirty_background_ratio(建議10)。hadoop-env.sh中設置HADOOP_NAMENODE_OPTS(如-Xmx4096m);Hadoop 3.x可手動配置內存分配。dfs.namenode.handler.count(默認10,建議調整為集群規模的20倍對數)。hdfs-site.xml中通過dfs.namenode.name.dir配置多個存儲目錄,提升可靠性。dfs.datanode.data.dir配置多磁盤目錄,分散數據存儲壓力。dfs.datanode.max.transfer.threads(默認4096,可增至8192)以提升并發讀寫能力。dfs.blocksize(如128MB或256MB,大文件建議更大)。core-site.xml中配置fs.trash.interval(如60分鐘)和fs.trash.checkpoint.interval,避免誤刪數據。TestDFSIO工具測試讀寫性能,分析網絡帶寬與磁盤I/O瓶頸。hdfs diskbalancer命令平衡節點內磁盤數據分布,避免單盤負載過高。Hadoop Archive工具),減少NameNode元數據壓力。dfs.hosts)限制節點訪問,防止惡意節點加入。hdfs dfsadmin -refreshNodes刷新節點狀態,無需重啟集群。注意事項:優化前需備份數據,測試環境驗證配置有效性,避免影響生產環境穩定性。