以下是在Ubuntu上搭建HDFS集群的步驟:
sudo apt update
和sudo apt install openjdk-8-jdk
安裝OpenJDK 8,并通過java -version
驗證安裝。sudo nano /etc/hostname
設置主機名,在/etc/hosts
中添加主機名和IP的映射關系。wget https://downloads.apache.org/hadoop/common/hadoop-3.3.4/hadoop-3.3.4.tar.gz
,然后解壓到指定目錄。~/.bashrc
或/etc/profile
,添加export HADOOP_HOME=/path/to/hadoop
和export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
,并使用source
命令使配置生效。fs.defaultFS
為hdfs://主機名:9000
,指定hadoop.tmp.dir
。dfs.replication
、dfs.namenode.name.dir
、dfs.datanode.data.dir
等屬性。yarn.nodemanager.aux - services
為mapreduce_shuffle
,指定yarn.resourcemanager.hostname
。$HADOOP_HOME/etc/hadoop/slaves
文件中添加所有DataNode的主機名。hdfs namenode -format
,僅在首次啟動時執行。start-dfs.sh
和start-yarn.sh
啟動HDFS和YARN服務。jps
命令查看進程,訪問http://主節點IP:50070
查看HDFS Web界面,確認集群狀態正常。