以下是在CentOS上配置HDFS的核心步驟解析,基于單節點基礎配置,高可用配置可在此基礎上擴展:
安裝Java
sudo yum install -y java-1.8.0-openjdk-devel
java -version
。配置網絡與主機名
/etc/hosts
,確保節點間IP與主機名可解析(如192.168.1.100 namenode
)。sudo systemctl stop firewalld
sudo systemctl disable firewalld
```。
下載并解壓
/usr/local/hadoop
):wget https://archive.apache.org/dist/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz
tar -xzvf hadoop-3.3.1.tar.gz -C /usr/local/
sudo mv /usr/local/hadoop-3.3.1 /usr/local/hadoop
```。
配置環境變量
/etc/profile.d/hadoop.sh
,添加:export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
source /etc/profile.d/hadoop.sh
。core-site.xml
<property>
<name>fs.defaultFS</name>
<value>hdfs://namenode:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop/tmp</value>
</property>
```。
hdfs-site.xml
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>/usr/local/hadoop/data/namenode</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/usr/local/hadoop/data/datanode</value>
</property>
```。
格式化NameNode
hdfs namenode -format
```。
啟動HDFS服務
start-dfs.sh
(需在NameNode節點執行)。jps
查看NameNode、DataNode進程是否運行。hdfs dfs -mkdir /user/test # 創建目錄
hdfs dfs -put /local/file /user/test # 上傳文件
hdfs dfs -ls /user/test # 查看文件
```。
http://namenode:50070
(默認端口),查看集群狀態。若需搭建高可用集群,需額外配置:
hdfs-site.xml
:添加dfs.ha.namenodes
、dfs.namenode.shared.edits.dir
等參數,啟用自動故障轉移。/usr/local/hadoop/data
)權限正確,建議使用hadoop
用戶運行服務。/etc/hosts
中配置主機名映射,并在slaves
文件中列出DataNode主機名。以上步驟參考自,可根據實際需求調整配置參數。