以下是在Ubuntu上搭建HDFS集群的步驟:
sudo apt update
和sudo apt install openjdk-11-jdk
安裝JDK,安裝后通過java -version
驗證。wget https://downloads.apache.org/hadoop/common/hadoop-3.3.4/hadoop-3.3.4.tar.gz
,然后解壓到指定目錄,如/usr/local/hadoop
。~/.bashrc
文件,添加export JAVA_HOME=/usr/lib/jvm/java-11-openjdk-amd64
、export HADOOP_HOME=/usr/local/hadoop
和export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
,最后執行source ~/.bashrc
使配置生效。/usr/local/hadoop/etc/hadoop
目錄下,編輯core-site.xml
,設置fs.defaultFS
為hdfs://localhost:9000
;編輯hdfs-site.xml
,設置dfs.replication
、dfs.namenode.name.dir
和dfs.datanode.data.dir
等屬性。sudo mkdir -p /path/to/hadoop/hdfs/namenode
和sudo mkdir -p /path/to/hadoop/hdfs/datanode
創建目錄,并通過sudo chown -R hdfs:hdfs /path/to/hadoop/hdfs
設置權限。hdfs namenode -format
。start-dfs.sh
啟動HDFS集群。若要配置高可用性,還需進行額外的配置,如設置JournalNode、配置hdfs-site.xml
和core-site.xml
中的相關參數等。