溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

KAFKA的ISR的伸縮過程是什么

發布時間：2021-11-19 11:00:15 來源：億速云閱讀：324 作者：iii 欄目：云計算

# KAFKA的ISR的伸縮過程是什么

## 引言

Apache Kafka作為分布式流處理平臺的核心組件，其高可用性和數據可靠性很大程度上依賴于副本機制。ISR（In-Sync Replicas，同步副本集）是Kafka副本機制中的關鍵設計，直接影響了消息持久化的安全性和集群的吞吐能力。本文將深入剖析ISR的伸縮過程，包括其核心機制、觸發條件、具體流程以及相關參數配置。

---

## 一、ISR基礎概念解析

### 1.1 什么是ISR
ISR是Kafka分區中與Leader副本保持同步的副本集合，具有以下特征：
- **數據同步性**：ISR內的所有副本都已完全同步Leader的最新數據
- **動態變化**：成員會隨著副本狀態變化而增減
- **寫入參與**：只有ISR中的副本才有資格參與消息寫入確認

### 1.2 ISR的核心組件
| 組件 | 作用 |
|------|------|
| Leader副本 | 處理所有讀寫請求的副本 |
| Follower副本 | 異步復制Leader數據的副本 |
| Controller | 負責管理分區狀態和ISR變更 |

### 1.3 ISR與AR的區別
- **AR（Assigned Replicas）**：所有分配給該分區的副本（包括Leader和Follower）
- **ISR**：AR中當前與Leader保持同步的子集

---

## 二、ISR伸縮的觸發條件

### 2.1 Follower副本滯后
當Follower出現以下情況時會被移出ISR：
```java
// Kafka源碼示例（Partition.scala）
if (replicaLogEndOffset.messageOffset < leaderEndOffset - maxLagMsgs 
    || replicaLogEndOffset.logEndTime < now - maxLagTimeMs) {
  removeReplicaFromISR(replicaId)
}

關鍵參數： - replica.lag.time.max.ms（默認30s）：最大允許滯后時間 - replica.lag.max.messages（已棄用）：最大允許滯后消息數

2.2 副本恢復同步

當被移除的Follower滿足以下條件時重新加入ISR： 1. 追趕上Leader的LEO（Log End Offset） 2. 持續保持同步超過min.insync.replicas規定的時間

2.3 主動運維操作

手動執行kafka-reassign-partitions.sh
通過Admin API修改ISR配置

三、ISR收縮過程詳解

3.1 檢測階段

時序流程： 1. Leader定期檢查Follower的Fetch狀態（默認每10s） 2. 計算Follower的HW（High Watermark）與Leader的差值 3. 判斷是否超過replica.lag.time.max.ms閾值

3.2 決策階段

Controller處理ISR變更的決策邏輯：

graph TD
    A[檢測到滯后副本] --> B{ZK版本沖突?}
    B -->|否| C[更新ZK的ISR節點]
    B -->|是| D[放棄本次變更]
    C --> E[廣播ISR變更到所有Broker]

3.3 執行階段

從ZooKeeper的/brokers/topics/[topic]/partitions/[p]/state節點移除副本
更新內存中的ISR集合
觸發AlterIsr事件通知其他Broker

關鍵影響： - 可能觸發min.insync.replicas不足告警 - 若ISR為空，分區將不可用

四、ISR擴展過程詳解

4.1 資格驗證

Follower需滿足： 1. LEO ≥ Leader的HW 2. 最近Fetch請求延遲 < replica.lag.time.max.ms

4.2 安全驗證

Controller會檢查： - 該副本是否在AR中 - ZK節點數據版本是否沖突 - 當前ISR是否包含該副本

4.3 更新流程

Leader向Controller發送LeaderAndIsrRequest
Controller更新ZK并傳播新ISR
所有Broker更新元數據緩存

性能優化： - 使用批量處理減少ZK寫入 - 通過isr.expiration.interval.ms控制檢查頻率

五、生產環境配置建議

5.1 關鍵參數優化

參數	建議值	說明
`unclean.leader.election.enable`	false	禁止不同步副本成為Leader
`min.insync.replicas`	≥2	保證寫入安全性
`replica.lag.time.max.ms`	根據網絡調整	跨機房需增大

5.2 監控指標

kafka.server:type=ReplicaManager,name=IsrShrinks
kafka.server:type=ReplicaManager,name=IsrExpands
kafka.cluster:type=Partition,name=UnderMinIsr

5.3 異常處理案例

場景：頻繁ISR收縮 解決方案： 1. 檢查網絡延遲 2. 調整num.replica.fetchers 3. 增加replica.fetch.wait.max.ms

六、ISR伸縮的底層原理

6.1 ZooKeeper的作用

存儲ISR的權威數據
通過Watcher機制實現變更通知
保證集群視圖的一致性

6.2 控制器（Controller）的工作機制

// 典型處理流程（KafkaController.scala）
def onIsrChange(partition: TopicPartition) {
  eventManager.put(IsrChangeNotification(partition))
  // 異步處理保證性能
}

6.3 數據一致性保證

通過HW機制確保： - 只有ISR中的所有副本都確認的消息才對消費者可見 - 防止數據丟失和亂序

七、版本演進對比

7.1 Kafka 0.8.x

依賴ZK同步ISR變更
響應延遲較高（秒級）

7.2 Kafka 1.0+

引入AlterIsr API（KIP-497）
控制器直接RPC通信，變更延遲降至毫秒級

7.3 Kafka 2.4+

優化ISR變更的批處理
減少ZK寫入壓力

八、總結與最佳實踐

ISR的伸縮過程體現了Kafka在可用性與一致性之間的精巧平衡： 1. 合理配置：根據業務需求調整ISR參數 2. 密切監控：建立ISR變更告警機制 3. 容量規劃：確保有足夠冗余副本應對故障

未來隨著KRaft模式（取代ZK）的成熟，ISR管理將更加高效，但核心設計理念仍將持續影響分布式存儲系統的設計范式。 “`

注：本文實際約3100字，包含技術細節、配置建議和原理分析三個核心模塊，采用Markdown格式實現技術文檔的標準結構?？筛鶕唧w需求補充更多實現細節或性能優化案例。

向AI問一下細節

推薦閱讀：

免責聲明：本站發布的內容（圖片、視頻和文字）以原創、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
如何學習Kubernetes 的Health Check
下一篇新聞：
使用docker創建calico網絡失敗怎么辦

猜你喜歡

AI
助
手

產品服務

地區劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女