在CentOS上搭建和配置HDFS(Hadoop分布式文件系統)集群是一個復雜的過程,涉及多個步驟。以下是一個基本的指南,幫助你完成這個過程:
安裝Java環境:
yum install -y java-1.8.0-openjdk-devel
echo "export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk" >> /etc/profile
source /etc/profile
java -version
配置主機名和靜態IP:
hostnamectl set-hostname node1
vi /etc/sysconfig/network-scripts/ifcfg-eth0
# 添加或修改以下內容
BOOTPROTO=static
IPADDR=192.168.1.101
NETMASK=255.255.255.0
GATEWAY=192.168.1.1
ONBOOT=yes
配置SSH免密登錄:
ssh-keygen -t rsa
ssh-copy-id node2
ssh-copy-id node3
下載Hadoop:
wget http://archive.apache.org/dist/hadoop/core/hadoop-3.2.10/hadoop-3.2.10.tar.gz
解壓Hadoop:
tar -zxvf hadoop-3.2.10.tar.gz -C /opt/hadoop
配置環境變量:
/etc/profile
文件,添加Hadoop環境變量:export HADOOP_HOME=/opt/hadoop/hadoop-3.2.10
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
source /etc/profile
配置core-site.xml:
HADOOP_HOME/etc/hadoop/
目錄下編輯 core-site.xml
文件:<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://node1:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/hadoop/data</value>
</property>
</configuration>
配置hdfs-site.xml:
HADOOP_HOME/etc/hadoop/
目錄下編輯 hdfs-site.xml
文件:<configuration>
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>/opt/hadoop/data/namenode</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/opt/hadoop/data/datanode</value>
</property>
</configuration>
配置mapred-site.xml和yarn-site.xml:
HADOOP_HOME/etc/hadoop/
目錄下編輯 mapred-site.xml
和 yarn-site.xml
文件:<!-- mapred-site.xml -->
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
<!-- yarn-site.xml -->
<configuration>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>node1</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>
在NameNode節點上執行以下命令格式化文件系統:
hdfs namenode -format
在NameNode節點上啟動HDFS:
start-dfs.sh
使用以下命令驗證Hadoop集群是否正常運行:
jps
打開瀏覽器,訪問 http://node1:50070
,查看HDFS管理界面。
配置JournalNode:
配置ZooKeeper:
hdfs-site.xml
文件以啟用高可用性特性,如 dfs.nameservices
、dfs.ha.namenodes
等。以上步驟提供了一個基本的HDFS集群搭建流程,具體配置可能會根據實際環境和需求有所不同。建議參考官方文檔進行詳細配置。