# Linux系統如何安裝Flink
Apache Flink 是一個開源的流處理框架,廣泛應用于大數據實時計算場景。本文將詳細介紹在Linux系統中安裝Flink的完整流程,涵蓋環境準備、安裝步驟和基礎驗證。
---
## 一、環境準備
### 1. 系統要求
- **操作系統**:Ubuntu 20.04/CentOS 7 或更高版本(本文以Ubuntu為例)
- **Java環境**:Flink 需要 Java 8/11(推薦 OpenJDK)
- **硬件配置**:至少 2GB 內存,10GB 磁盤空間
### 2. 安裝依賴
```bash
# 更新系統軟件包
sudo apt update && sudo apt upgrade -y
# 安裝OpenJDK 11
sudo apt install openjdk-11-jdk -y
# 驗證Java安裝
java -version
從Flink官網下載穩定版(本文以1.17.1為例):
wget https://dlcdn.apache.org/flink/flink-1.17.1/flink-1.17.1-bin-scala_2.12.tgz
tar -xzf flink-1.17.1-bin-scala_2.12.tgz
mv flink-1.17.1 /opt/flink
編輯 ~/.bashrc 文件:
echo 'export FLINK_HOME=/opt/flink' >> ~/.bashrc
echo 'export PATH=$PATH:$FLINK_HOME/bin' >> ~/.bashrc
source ~/.bashrc
修改 conf/flink-conf.yaml:
# 設置JobManager地址(單機模式可不修改)
jobmanager.rpc.address: localhost
# 調整內存分配(根據實際硬件調整)
taskmanager.memory.process.size: 1024m
# 啟動單機集群
$FLINK_HOME/bin/start-cluster.sh
# 驗證進程
jps
# 應顯示 StandaloneSessionClusterEntrypoint 和 TaskManagerRunner
瀏覽器訪問 http://<服務器IP>:8081,可查看集群狀態和任務監控。
# 運行WordCount示例
$FLINK_HOME/bin/flink run $FLINK_HOME/examples/batch/WordCount.jar
任務完成后,輸出日志會顯示計算結果路徑(默認在 log 目錄下)。
錯誤提示:UnsupportedClassVersionError
解決方案:確認Java版本符合要求,可通過 update-alternatives --config java 切換版本。
錯誤提示:Address already in use
解決方案:修改 conf/flink-conf.yaml 中的 rest.port 參數。
錯誤提示:OutOfMemoryError
解決方案:調整 conf/flink-conf.yaml 中的內存配置參數。
配置ZooKeeper以實現JobManager高可用:
high-availability: zookeeper
high-availability.zookeeper.quorum: zk1:2181,zk2:2181
若需訪問HDFS,需下載對應版本的flink-shaded-hadoop包并放入lib目錄。
通過上述步驟,您已完成Flink在Linux系統上的基礎安裝與驗證。后續可進一步探索: - 使用Flink SQL進行流批一體處理 - 部署Kubernetes原生集群 - 集成Kafka等消息隊列
如需更詳細的配置指南,請參考官方文檔。 “`
注:實際部署時請根據生產環境需求調整內存、網絡等參數。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。