Linux下Hadoop資源管理主要涉及配置、監控、調度及優化等方面,具體如下:
core-site.xml(配置文件系統URI等核心參數)、hdfs-site.xml(設置副本數、塊大小等HDFS參數)、yarn-site.xml(配置ResourceManager、NodeManager資源參數)、mapred-site.xml(指定MapReduce運行框架為YARN)。~/.bashrc或/etc/profile中添加HADOOP_HOME、PATH等變量。hdfs namenode -format),執行start-dfs.sh和start-yarn.sh啟動服務。yarn-site.xml中yarn.nodemanager.resource.memory-mb等參數。http://<ResourceManager_IP>:8088)查看集群狀態、應用程序資源使用情況。yarn node -list查看節點狀態,yarn application -list查看運行中的任務,yarn application -kill <ID>終止任務。capacity-scheduler.xml或fair-scheduler.xml中設置隊列資源分配比例和優先級。mapreduce.map.memory.mb、mapreduce.reduce.memory.mb等參數,避免內存溢出。dfs.replication)。參考來源: