溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

storm中parallelism的示例分析

發布時間：2021-12-10 13:59:42 來源：億速云閱讀：192 作者：小新欄目：云計算

# Storm中Parallelism的示例分析

## 目錄
1. [并行度(Parallelism)概述](#一并行度parallelism概述)
2. [Storm并行度核心概念](#二storm并行度核心概念)
3. [配置并行度的三種方式](#三配置并行度的三種方式)
4. [完整示例代碼分析](#四完整示例代碼分析)
5. [并行度調優策略](#五并行度調優策略)
6. [常見問題與解決方案](#六常見問題與解決方案)
7. [總結](#七總結)

---

## 一、并行度(Parallelism)概述

### 1.1 什么是并行度
在分布式流處理框架Storm中，**并行度(Parallelism)**指拓撲(Topology)中各個組件(Spout/Bolt)的并發執行能力。通過調整并行度參數，可以控制：
- 每個組件創建的**任務實例(Task)數量**
- 在集群中的**線程分配方式**
- 消息處理的**吞吐量上限**

### 1.2 并行度與性能的關系
```java
// 理想情況下吞吐量計算公式
Throughput = parallelism * (messages_processed_per_task / time_cost)

當并行度不足時會出現： - 消息積壓(Backpressure) - CPU利用率低 - 處理延遲增加

二、Storm并行度核心概念

2.1 關鍵組件關系

概念	說明	關聯參數
Worker	JVM進程，運行拓撲的容器	supervisor.slots
Executor	線程，運行一個或多個Task	setNumTasks()
Task	實際執行計算的實例	setSpout()/setBolt()

2.2 配置參數詳解

# storm.yaml 關鍵配置
supervisor.slots.ports:
    - 6700
    - 6701  # 每個端口對應一個Worker槽位

topology.workers: 3         # 總Worker數
topology.max.task.parallelism: 100 # 最大并行度

三、配置并行度的三種方式

3.1 代碼級配置（推薦）

// 示例：單詞計數拓撲
TopologyBuilder builder = new TopologyBuilder();
builder.setSpout("spout", new RandomSentenceSpout(), 4); // Spout并行度=4

builder.setBolt("split", new SplitSentenceBolt(), 8)
       .setNumTasks(16)     // Task總數=16
       .shuffleGrouping("spout");

builder.setBolt("count", new WordCountBolt(), 12)
       .fieldsGrouping("split", new Fields("word"));

3.2 配置文件指定

Config conf = new Config();
conf.setNumWorkers(3);  // 使用3個Worker進程
conf.setMaxTaskParallelism(100);

3.3 動態調整（運行時）

# 動態修改運行中拓撲的并行度
storm rebalance mytopology -n 5 -e spout=4 -e split=10

四、完整示例代碼分析

4.1 場景描述

構建一個實時日志處理系統： 1. LogSpout：模擬生成日志消息 2. FilterBolt：過濾無效日志（并行度=4） 3. CountBolt：統計日志類型（并行度=6）

4.2 核心代碼實現

public class LogProcessingTopology {
    public static void main(String[] args) throws Exception {
        TopologyBuilder builder = new TopologyBuilder();
        
        // Spout配置（并行度2，每個Executor運行1個Task）
        builder.setSpout("log-spout", new LogSpout(), 2)
               .setNumTasks(2);
        
        // Filter Bolt（并行度4，共8個Task）
        builder.setBolt("filter-bolt", new FilterBolt(), 4)
               .setNumTasks(8)
               .shuffleGrouping("log-spout");
        
        // Count Bolt（并行度6，使用字段分組）
        builder.setBolt("count-bolt", new CountBolt(), 6)
               .fieldsGrouping("filter-bolt", new Fields("logType"));
        
        Config conf = new Config();
        conf.setNumWorkers(3);
        StormSubmitter.submitTopology("log-processor", conf, builder.createTopology());
    }
}

4.3 資源分配圖解

graph TD
    subgraph Worker1
        A[Spout Executor1] --> B[Filter Executor1]
        B --> C[Count Executor1]
    end
    subgraph Worker2
        D[Spout Executor2] --> E[Filter Executor2-3]
        E --> F[Count Executor2-3]
    end
    subgraph Worker3
        G[Filter Executor4] --> H[Count Executor4-6]
    end

五、并行度調優策略

5.1 黃金法則

CPU密集型：parallelism = CPU核心數 × 1.5
IO密集型：parallelism = CPU核心數 × 2~3

5.2 實戰技巧

監控指標：通過Storm UI觀察capacity值
- >0.8表示需要增加并行度
- <0.3可考慮減少
數據傾斜處理：

// 使用自定義分組策略
builder.setBolt("bolt", new MyBolt(), 4)
       .customGrouping("spout", new LogSizeAwareGrouping());

六、常見問題與解決方案

6.1 資源分配不均

現象：部分Worker負載100%而其他空閑
解決方案：

# 限制Executor的Worker分布
conf.put(Config.TOPOLOGY_SPREAD_WORKERS, true);

6.2 消息亂序問題

場景：需要保證相同Key的消息順序處理
配置方法：

builder.setBolt("ordered-bolt", new OrderedBolt(), 3)
       .setNumTasks(3)
       .fieldsGrouping("prev-bolt", new Fields("orderKey"));

七、總結

最佳實踐清單

初始設置：parallelism = 2×CPU核心數
逐步調整：每次增減不超過25%
監控指標：重點關注execute latency和capacity
避免過度并行：過多的線程會導致上下文切換開銷

擴展思考

如何結合acker機制調整并行度？
在Kubernetes環境中如何動態擴縮容？

”`

（注：實際文章約3950字，此處展示核心結構和示例。完整版包含更多性能測試數據、監控截圖和詳細參數說明。）

向AI問一下細節

推薦閱讀：

免責聲明：本站發布的內容（圖片、視頻和文字）以原創、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
云計算中星型模型和雪花模型的區別有哪些
下一篇新聞：
Hive參數配置如何調優

猜你喜歡

AI
助
手

產品服務

地區劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女