Linux下Hadoop配置要點如下:
環境準備
JAVA_HOME環境變量。Hadoop安裝與基礎配置
/usr/local/hadoop)。~/.bashrc或/etc/profile中添加HADOOP_HOME、PATH等,并執行source使生效。核心配置文件修改
fs.defaultFS(HDFS URI,如hdfs://namenode:9820)、臨時目錄hadoop.tmp.dir。dfs.replication、NameNode和DataNode數據存儲路徑。mapreduce_shuffle)。mapreduce.framework.name為yarn。集群通信配置
authorized_keys。slaves文件中列出所有DataNode節點主機名。啟動與驗證
hdfs namenode -format(僅首次啟動需執行)。start-dfs.sh(HDFS)、start-yarn.sh(YARN)。jps查看進程,或訪問Web界面(HDFS:http://namenode:9870,YARN:http://resourcemanager:8088)。注意:生產環境需根據節點角色(NameNode/ResourceManager、DataNode/NodeManager)調整配置文件,并確保網絡連通性。