在Linux環境下對Zookeeper進行故障排查可以通過以下步驟進行:
檢查Zookeeper進程狀態:
jps 檢查Zookeeper進程是否正在運行。如果未運行,則嘗試啟動它:/usr/zookeeper-3.4.6/bin/zkServer.sh start。查看Zookeeper服務狀態:
/usr/zookeeper-3.4.6/bin/zkServer.sh status 檢查Zookeeper服務的狀態。如果服務未正常運行,可能會看到類似“Error contacting service. It is probably not running”的錯誤信息。檢查防火墻設置:
sudo systemctl status firewalld
sudo systemctl stop firewalld
sudo systemctl disable firewalld
查看Zookeeper日志:
/var/log/zookeeper/zookeeper.out。使用以下命令查看日志:tail -f /var/log/zookeeper/zookeeper.out
重啟Zookeeper服務:
/usr/zookeeper-3.4.6/bin/zkServer.sh restart
清理并重建Zookeeper數據目錄:
rm -rf /var/lib/zookeeper/data/
檢查配置文件:
zoo.cfg 沒有錯誤,特別是 dataDir 和 server.X 配置項。配置文件通常位于 /usr/zookeeper-3.4.6/conf/zoo.cfg。使用四字命令監控集群狀態:
stat, ruok, mntr 等)來監控集群狀態和調試問題:echo stat | nc localhost 2181
echo ruok | nc localhost 2181
echo mntr | nc localhost 2181