以下是在Linux中搭建HDFS集群的基本步驟:
/etc/profile或~/.bashrc文件,添加Hadoop相關環境變量并使其生效。core-site.xml,設置HDFS默認文件系統和NameNode地址;修改hdfs-site.xml,配置數據存儲目錄、副本數等;在slaves文件中列出DataNode主機名。hdfs namenode -format命令。start-dfs.sh啟動NameNode,在所有DataNode節點上執行該命令啟動DataNode。hdfs dfsadmin -report命令查看集群狀態,或通過瀏覽器訪問NameNode的Web界面進行查看。若要配置高可用性,還需設置NameNode主備節點、JournalNode及ZooKeeper等相關配置。