在CentOS系統中,HDFS(Hadoop Distributed File System)的常用命令主要包括以下幾類:
啟動HDFS
start-dfs.sh
停止HDFS
stop-dfs.sh
格式化NameNode(僅在首次啟動或重置集群時使用)
hdfs namenode -format
查看HDFS狀態
hdfs dfsadmin -report
創建目錄
hdfs dfs -mkdir /path/to/directory
刪除目錄或文件
hdfs dfs -rm -r /path/to/directory
hdfs dfs -rm /path/to/file
上傳文件到HDFS
hdfs dfs -put localfile /path/to/hdfs
從HDFS下載文件到本地
hdfs dfs -get /path/to/hdfs localfile
查看HDFS中的文件和目錄列表
hdfs dfs -ls /path/to/directory
復制文件或目錄
hdfs dfs -cp /source/path /destination/path
移動或重命名文件或目錄
hdfs dfs -mv /source/path /destination/path
更改文件或目錄的權限
hdfs dfs -chmod 755 /path/to/file_or_directory
更改文件或目錄的所有者
hdfs dfs -chown username:groupname /path/to/file_or_directory
設置副本因子
hdfs dfs -setrep -w 3 /path/to/file
檢查文件的塊信息
hdfs fsck /path/to/file -files -blocks -locations
查看HDFS的塊報告
hdfs dfsadmin -report
調整HDFS配置
hdfs-site.xml
和core-site.xml
文件,然后重啟HDFS服務。查看HDFS的NameNode和DataNode日志
$HADOOP_HOME/logs
目錄下。使用Web界面監控HDFS
http://namenode_host:50070
。列出所有正在運行的Java進程
jps
查找特定進程ID的進程信息
ps -ef | grep <process_name>
殺死進程
kill -9 <process_id>
sudo
)。總之,熟練掌握這些HDFS常用命令對于日常管理和維護Hadoop集群至關重要。