Debian系統下Kafka故障排查方法如下:
systemctl status kafka
查看服務狀態,確保Kafka進程正常運行。/var/log/kafka/server.log
),分析錯誤信息如Input/Output error
、OOM
等。/etc/kafka/server.properties
,確認listeners
、advertised.listeners
、zookeeper.connect
等配置正確。log.dirs
目錄存在且有寫權限。top
、free -h
、df -h
監控CPU、內存、磁盤空間,確保資源充足。jstat
或GC日志分析內存管理問題,排查內存泄漏或頻繁GC。ping
、telnet
測試網絡連通性,確保Kafka節點間及客戶端通信正常。zkCli.sh
驗證Kafka與ZooKeeper的連接狀態。kafka-topics.sh
查看Topic分布、分區狀態,檢查是否有異常副本(OSR)。kafka-reassign-partitions.sh
重新分配分區。cmdline-jmxclient.jar
獲取JMX指標(如Leader數、副本同步狀態)。fsck
修復文件系統錯誤(非正常關機后)。操作前建議:備份重要數據,優先通過日志和配置調整解決問題,避免盲目重啟服務。若問題復雜,可參考Kafka官方文檔或社區論壇尋求進一步支持。