以下是Ubuntu配置HDFS時的常見問題及解決方案:
環境變量配置錯誤
hdfs
命令無法識別,提示No such file or directory
。HADOOP_HOME
或PATH
環境變量,或腳本權限不足。~/.bashrc
,添加export HADOOP_HOME=/path/to/hadoop
和export PATH=$PATH:$HADOOP_HOME/bin
,執行source ~/.bashrc
。start-dfs.sh
等腳本有可執行權限:chmod +x /path/to/hadoop/sbin/start-dfs.sh
。節點間通信異常
Connection refused
或節點無法加入集群。/etc/hosts
中主機名與IP映射錯誤,或SSH免密登錄未配置。/etc/hosts
,確保主節點與從節點的IP和主機名一致。id_rsa.pub
復制到從節點的~/.ssh/authorized_keys
。權限不足問題
Permission denied
。hadoop
用戶)執行操作,或目錄權限設置錯誤。hadoop
用戶:sudo su - hadoop
,或使用sudo -u hadoop
執行命令。hdfs dfs -chmod -R 750 /目標路徑
,或修改所有者hdfs dfs -chown hadoop:hadoop /目標路徑
。配置文件格式錯誤
XML格式錯誤
或參數無效
。core-site.xml
、hdfs-site.xml
等配置文件存在語法錯誤或參數沖突。fs.defaultFS
需為hdfs://主機名:端口
)。NameNode無法啟動
NameNode
進程未啟動,或啟動后立即退出。hdfs namenode -format
。dfs.namenode.name.dir
指定的目錄存在且可寫,建議使用絕對路徑(如/home/hadoop/hdfs/namenode
)。端口沖突
Address already in use
。hdfs-site.xml
中的端口號(如dfs.namenode.rpc-address
),避免與其他服務沖突。netstat -tulnp
查看端口占用情況,終止沖突進程。數據塊副本異常
dfs.replication
參數設置后,副本數未生效。hdfs-site.xml
中設置dfs.replication
(如<value>3</value>
),重啟HDFS服務。hdfs dfsadmin -report
確認副本狀態,確保DataNode正常運行。參考來源: