在Ubuntu上配置Hadoop是一個相對復雜的過程,涉及多個步驟。以下是一個詳細的指南,幫助你在Ubuntu系統上安裝和配置Hadoop。
java -version
如果沒有安裝,請執行以下命令安裝:
sudo apt update
sudo apt install openjdk-11-jdk
sudo systemctl status ssh
wget https://hadoop.apache.org/release/hadoop-3.3.6.tar.gz
將下載的安裝包解壓到指定目錄:
tar -xzvf hadoop-3.3.6.tar.gz -C /usr/local/
在~/.bashrc
文件中添加Hadoop環境變量:
nano ~/.bashrc
在文件末尾添加如下內容:
export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
保存并退出后,運行以下命令使更改生效:
source ~/.bashrc
在$HADOOP_HOME/etc/hadoop
目錄下,存在多個配置文件。主要配置如下:
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
</configuration>
hdfs namenode -format
./sbin/start-dfs.sh
./sbin/start-yarn.sh
http://localhost:50070
查看HDFS狀態。http://localhost:8088
查看YARN資源管理器。以上步驟可以幫助你在Ubuntu上配置Hadoop環境。請根據具體需求和環境進行調整。