CentOS HDFS集群擴容策略
core-site.xml(如fs.defaultFS指向NameNode)、hdfs-site.xml(如副本因子dfs.replication)等核心配置文件;調整網絡設置(關閉防火墻或放行HDFS端口:NameNode默認50070/9870、DataNode默認50010/50020)、配置SSH免密登錄(便于NameNode與新節點通信)。hadoop/etc/hadoop目錄下創建/更新dfs.hosts文件,添加新節點的主機名或IP;修改hdfs-site.xml,設置dfs.hosts參數指向該文件;將配置分發至所有節點,后續通過hdfs dfsadmin -refreshNodes命令刷新,確保新節點能正常注冊。ntpdate工具),避免因時間差導致心跳檢測失敗。hdfs-site.xml、core-site.xml等配置文件復制到新節點的Hadoop配置目錄(如/etc/hadoop/conf),確保配置一致性。start-dfs.sh(或單獨執行hadoop-daemon.sh start datanode),啟動DataNode進程;若集群啟用了YARN,還需啟動yarn-daemon.sh start nodemanager。http://namenode_host:9870/dfshealth.html#tab-datanode)或命令hdfs dfsadmin -report,查看新節點的狀態(如“Live”表示存活),確認其已成功加入集群。hdfs balancer命令觸發數據均衡(如hdfs balancer -threshold 10,其中threshold為閾值,默認10%,表示節點存儲使用率差異超過10%時啟動平衡);平衡過程會將數據從滿節點遷移至新節點,實現存儲資源均勻分布。hdfs balancer -status命令查看平衡狀態(如“Running”表示進行中、“Idle”表示完成);平衡過程可能耗時較長,需避免在業務高峰期執行。/dev/sdb),執行fdisk /dev/sdb分區、mkfs.xfs /dev/sdb1格式化(推薦XFS文件系統,支持大文件和高并發);創建掛載點(如/data/newdisk),編輯/etc/fstab實現開機自動掛載。hdfs-site.xml文件,添加新存儲目錄到dfs.datanode.data.dir屬性(如<property><name>dfs.datanode.data.dir</name><value>/data/olddisk,/data/newdisk</value></property>);重啟DataNode服務(hadoop-daemon.sh restart datanode)使配置生效。hdfs dfsadmin -report命令查看DataNode的存儲使用情況,確認新存儲目錄已被納入集群。hdfs dfsadmin -report確認所有節點(包括新節點)狀態為“Live”;檢查NameNode和DataNode的日志(如/var/log/hadoop-hdfs/hadoop-hdfs-namenode.log),確保無報錯信息。dfs.namenode.handler.count(NameNode線程池大小,默認10)以提升元數據操作性能,調整dfs.blocksize(塊大小,默認128M/256M)以適應大文件存儲需求。