Ubuntu HDFS存儲擴展主要有**橫向擴容(新增節點)和縱向擴容(提升單機硬件)**兩種方式,具體操作如下:
JAVA_HOME和HADOOP_HOME環境變量。hdfs-site.xml中添加新節點的DataNode存儲路徑(如dfs.datanode.data.dir),并更新workers文件(路徑:/usr/local/hadoop/etc/hadoop/workers),添加新節點主機名。scp命令)。hdfs --daemon start datanode,啟動DataNode服務。hdfs dfsadmin -report命令查看新節點是否加入集群。hdfs balancer -threshold 5(-threshold為負載差異閾值,單位%),將數據均勻分布到新節點。fdisk或lsblk命令添加新硬盤,格式化并掛載到指定目錄(如/data2),修改/etc/fstab實現開機自動掛載。hdfs-site.xml中dfs.datanode.data.dir屬性,添加新掛載目錄(多個目錄用逗號分隔),例如:<property>
<name>dfs.datanode.data.dir</name>
<value>/data1,/data2</value>
</property>
sudo systemctl restart hadoop-datanode。參考來源: