在CentOS上排查Zookeeper故障可以按照以下步驟進行:
檢查Zookeeper服務狀態:
sudo systemctl status zookeeper
sudo systemctl start zookeeper
sudo systemctl enable zookeeper
查看Zookeeper日志:
/var/log/zookeeper
目錄下,可以直接查看或通過以下命令查看 zookeeper.out
日志文件:cat /var/log/zookeeper/zookeeper.out
使用四字命令監控集群狀態:
stat
:顯示服務器的運行狀態,包括連接的客戶端數量、節點的角色(Leader、Follower)等。ruok
:檢查Zookeeper是否正在運行,返回 imok
表示正常運行。mntr
:提供集群的詳細運行信息,包括Leader/Follower狀態、事務處理數量等。cons
:顯示客戶端連接的詳細信息,包括客戶端IP、延遲和請求隊列情況。srvr
:顯示服務器的狀態,類似于 stat
,但包含更多的節點性能指標。wchs
:顯示Watch監視器的狀態,列出當前有多少Watch被注冊,幫助了解Watch機制是否工作正常。檢查配置文件:
/etc/zookeeper/conf/zoo.cfg
,確保所有參數設置正確,如服務器地址、數據目錄路徑、客戶端連接端口等。檢查網絡連接:
檢查資源使用情況:
日志分析:
zoo.cfg
文件中找到。處理常見故障:
升級Zookeeper版本: