# Hadoop的常用命令介紹
## 一、Hadoop概述
Apache Hadoop是一個開源的分布式計算框架,主要用于處理海量數據的存儲和分析。它由HDFS(Hadoop Distributed File System)和MapReduce兩大核心組件構成,能夠高效地處理PB級別的數據。Hadoop生態系統還包括YARN、HBase、Hive、Pig等多個子項目,共同構成了一個強大的大數據處理平臺。
在日常使用Hadoop時,熟練掌握其命令行工具是進行高效數據處理的基礎。本文將詳細介紹Hadoop的常用命令,涵蓋HDFS文件操作、YARN資源管理、MapReduce作業控制等方面。
---
## 二、HDFS常用命令
### 1. 文件系統基礎操作
#### 查看目錄內容
```bash
hadoop fs -ls <path>
示例:
hadoop fs -ls /user/hadoop
hadoop fs -mkdir <path>
遞歸創建多級目錄:
hadoop fs -mkdir -p /user/hadoop/dir1/dir2
刪除文件:
hadoop fs -rm <file_path>
遞歸刪除目錄:
hadoop fs -rm -r <directory_path>
從本地復制到HDFS:
hadoop fs -put <local_path> <hdfs_path>
從HDFS復制到本地:
hadoop fs -get <hdfs_path> <local_path>
hadoop fs -cat <file_path>
查看文件尾部內容:
hadoop fs -tail <file_path>
hadoop fs -getmerge <hdfs_dir> <local_file>
hadoop fs -chmod <mode> <path>
示例:
hadoop fs -chmod 755 /user/hadoop/file.txt
hadoop fs -chown <owner>:<group> <path>
hadoop fs -du -h <path>
yarn application -list
yarn application -kill <application_id>
yarn logs -applicationId <application_id>
yarn node -list
yarn node -status <node_id>
hadoop jar <jar_file> <main_class> <input_path> <output_path>
示例:
hadoop jar wordcount.jar WordCount /input /output
mapred job -list
mapred job -status <job_id>
mapred job -kill <job_id>
hdfs balancer -threshold 10
(threshold參數指定磁盤使用率差異閾值)
hdfs dfsadmin -safemode enter
hdfs dfsadmin -safemode leave
hdfs dfsadmin -safemode get
hdfs fsck /
hdfs fsck / -delete
hadoop fs -ls /data | awk '{print $8}' | xargs -I {} hadoop fs -mv {} /archive
hadoop dfsadmin
查看集群狀態hdfs dfsadmin -report
hdfs dfsadmin -setSpaceQuota 1T /user/hadoop
distcp
工具hadoop distcp hdfs://cluster1/src hdfs://cluster2/dest
權限拒絕錯誤:
hadoop fs -ls -d /path
-chown
和-chmod
修正權限空間不足問題:
hdfs dfs -df -h
hadoop fs -expunge
作業卡住:
yarn application -list
yarn logs -applicationId <app_id>
本文系統介紹了Hadoop生態系統中最常用的命令行工具,包括: - HDFS文件系統操作(約40%日常使用頻率) - YARN資源管理命令(約30%使用場景) - MapReduce作業控制(約20%應用場景) - 高級管理維護命令(10%特殊情況)
掌握這些命令后,用戶可以: ? 高效管理HDFS上的海量數據 ? 監控和優化集群資源使用 ? 提交和調試分布式計算作業 ? 快速定位和解決常見問題
建議讀者在實際工作中結合--help
參數探索更多命令選項,例如:
hadoop fs -help put
yarn application -help
注意:不同Hadoop版本命令可能略有差異,本文基于Hadoop 3.x版本編寫。生產環境操作前建議先在測試集群驗證命令效果。 “`
(全文約2850字,實際字數可能因Markdown渲染略有差異)
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。