Hadoop在Linux上的故障排查可按以下步驟進行:
$HADOOP_HOME/logs目錄,使用tail -f *.log或grep "ERROR" *.log實時查看或搜索錯誤信息。jps命令確認NameNode、DataNode、ResourceManager等進程是否正常運行。ping測試節點間連通性,netstat或ss檢查端口監聽狀態,確保防火墻開放所需端口(如50070、8088等)。core-site.xml、hdfs-site.xml等配置參數(如fs.defaultFS、路徑權限)是否正確。top、vmstat、df -h等工具監控CPU、內存、磁盤空間,排查資源不足問題。hdfs dfsadmin -report查看HDFS狀態,yarn node -list查看YARN節點狀態。hdfs dfs -chmod調整文件權限。若以上步驟無法解決,可參考官方文檔或在社區(如Stack Overflow)尋求幫助。