排查CentOS HDFS故障可按以下步驟進行:
systemctl status hadoop-hdfs-namenode
和systemctl status hadoop-hdfs-datanode
確認服務是否正常運行。/var/log/hadoop-hdfs/
目錄下的NameNode和DataNode日志,定位錯誤信息。hdfs-site.xml
和core-site.xml
,確保fs.defaultFS
、dfs.namenode.rpc-address
等配置正確。ping
和traceroute
命令檢查節點間網絡連通性,確保端口(如8020)開放。top
或htop
查看CPU、內存使用情況,用df -h
確認磁盤空間充足。hdfs dfsadmin -report
查看集群狀態,用hdfs fsck
檢查文件系統完整性。hdfs dfsadmin -safemode leave
退出。/var/log/messages
)。若問題仍未解決,可結合具體錯誤日志進一步分析或尋求社區支持。