溫馨提示×

Kafka監控配置哪些指標關鍵

小樊
44
2025-08-20 07:43:39
欄目: 大數據

Kafka監控需重點關注以下關鍵指標,覆蓋集群、生產者、消費者及ZooKeeper等組件,確保系統穩定運行:

一、Broker核心指標

  • 資源使用:CPU、內存、磁盤使用率,網絡I/O及磁盤I/O負載。
  • 副本同步UnderReplicatedPartitions(未同步分區數,>0表示副本異常)、ISRShrinksPerSec/ISRExpandsPerSec(ISR收縮/擴展頻率)。
  • 集群狀態ActiveControllerCount(活躍Controller數量,正常應為1)、OfflinePartitionsCount(離線分區數,>0需排查)。
  • 請求處理MessagesInPerSec(消息吞吐量)、BytesIn/BytesOutPerSec(流量監控)、RequestHandlerAvgIdlePercent(Handler空閑率,過低表示壓力大)。

二、生產者關鍵指標

  • 發送效率record-send-rate(消息發送速率)、request-latency-avg(請求平均延遲)、batch-size-avg(批量大?。?。
  • 可靠性record-error-rate(錯誤率)、retries(重試次數),需關注acks配置是否為all以保證數據不丟失。

三、消費者關鍵指標

  • 消費進度records-lag(消費滯后量,>0表示積壓,需告警)、fetch-rate(拉取速率)、commit-rate(Offset提交頻率)。
  • 性能狀態poll-latency-avg(拉取延遲,>100ms需關注)、heartbeat-rate(心跳頻率,異??赡苡|發重平衡)。

四、Topic/分區指標

  • 流量與積壓LogEndOffset(最新位點)、LogStartOffset(起始位點)、Size(分區占用磁盤大?。?。
  • 健康狀態IsrShrinksPerSec(ISR縮減頻率,頻繁收縮需排查Follower異常)。

五、ZooKeeper指標(v3.x前需關注)

  • 節點狀態:ZK節點在線狀態、會話超時次數。
  • 請求性能ZookeeperRequestLatency(請求延遲)、ZookeeperOutstandingRequests(未處理請求數)。

六、JVM監控

  • 內存與GC:堆內存使用率、Full GC頻率及耗時,避免頻繁GC導致性能抖動。

工具推薦:通過Prometheus+Grafana采集JMX指標,結合Kafka自帶命令行工具(如kafka-consumer-groups.sh)輔助驗證。

以上指標覆蓋Kafka核心運行狀態,可根據業務場景調整告警閾值,例如對records-lagUnderReplicatedPartitions設置嚴格告警規則。

0
亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女