broker.id
重復、log.dirs
路徑不存在)、Zookeeper未啟動、端口沖突、權限不足。server.properties
中broker.id
唯一性、log.dirs
路徑有效性(需提前創建目錄并賦予權限)。systemctl status zookeeper
,未啟動則執行systemctl start zookeeper
。netstat -tuln | grep 9092
,修改listeners
配置避免沖突。Connection refused
或TimeoutException
。advertised.listeners
配置錯誤、網絡分區。sudo ufw allow 9092
(或對應Kafka端口)。advertised.listeners
是否為集群節點實際IP或域名(如PLAINTEXT://node1:9092
)。ping
或telnet
測試節點間網絡連通性。num.partitions
(主題分區數)提升并行度。compression.type=gzip
)并增大batch.size
/linger.ms
參數。OutOfMemoryError
或磁盤寫滿。buffer.memory
配置不合理、日志保留策略不當。kafka-server-start.sh
中KAFKA_HEAP_OPTS
,建議設置為可用內存的50%-70%(如-Xms4G -Xmx4G
)。log.retention.hours
(如設置為168小時)和log.retention.bytes
控制日志保留量。log.dirs
所在磁盤有足夠空間。ZooKeeper connection lost
或Session expired
。zookeeper.connect
配置錯誤、會話超時。systemctl status zookeeper
,確保正常運行。zookeeper.connect
參數為正確的Zookeeper地址(如localhost:2181
)。zookeeper.session.timeout.ms
參數(默認10秒,可根據網絡延遲調整)。Permission denied
或NoSuchFileException
。log.dirs
、dataDir
等路徑存在且為絕對路徑,使用正斜杠(/
)或雙反斜杠(\\
)。chmod -R 777 /path/to/kafka/logs
。inter.broker.protocol.version
參數。tail -f /path/to/kafka/logs/server.log
定位錯誤詳情。Kafka Manager
或Prometheus+Grafana
監控集群狀態、內存和磁盤使用情況。參考來源:[1,2,3,4,5,6,7,8,9,10,11]