以下是在Ubuntu上排查Zookeeper故障的常用操作:
查看日志
/var/log/zookeeper/zookeeper.out 或 dataDir目錄(配置文件中指定)。cat /var/log/zookeeper/zookeeper.out 或 tail -f 日志文件,分析錯誤信息。檢查配置文件
/etc/zookeeper/conf/zoo.cfg。dataDir(數據目錄權限)、clientPort(端口配置)、myid(集群節點ID)等參數是否正確。驗證Java環境
java -version。JAVA_HOME環境變量是否配置正確。檢查網絡與端口
ping <節點IP>、telnet <節點IP> <端口>(默認2181)。sudo netstat -tuln | grep 2181,若被占用需終止進程或修改端口。檢查系統資源
free -h(內存)、df -h(磁盤)。top。使用四字命令監控集群狀態
echo stat | nc localhost 2181查看節點角色、連接數等狀態。ruok(檢查服務是否運行)、mntr(詳細監控信息)。處理常見故障場景
dataDir下的zookeeper_server.pid和version-2目錄后重啟。zoo.cfg中端口并重啟服務。sync命令同步節點數據。重啟服務
sudo systemctl restart zookeeper 或 ./zkServer.sh start。提示:操作前建議備份配置文件和數據目錄,若問題復雜可參考Zookeeper官方文檔或社區論壇。