在Debian系統上提交Hadoop作業通常涉及以下步驟:
環境準備:
HADOOP_HOME
和 PATH
。編寫MapReduce作業:
上傳JAR文件到Hadoop:
hadoop fs -put
命令將JAR文件上傳到HDFS(Hadoop分布式文件系統)。hadoop fs -put /path/to/your-job.jar /user/hadoop/
準備輸入數據:
hadoop fs -put /path/to/input /user/hadoop/input
提交作業:
hadoop jar
命令提交作業。hadoop jar /user/hadoop/your-job.jar com.yourcompany.YourJobClass /user/hadoop/input /user/hadoop/output
其中:
/user/hadoop/your-job.jar
是你的JAR文件路徑。com.yourcompany.YourJobClass
是你的主類(包含 main
方法的類)。/user/hadoop/input
是輸入數據的HDFS路徑。/user/hadoop/output
是輸出數據的HDFS路徑(作業完成后會生成)。監控作業:
yarn application -list
命令查看作業狀態。yarn application -list
獲取作業輸出:
hadoop fs -get
命令將輸出數據從HDFS下載到本地文件系統。hadoop fs -get /user/hadoop/output /path/to/local/output
通過以上步驟,你可以在Debian系統上成功提交和運行Hadoop作業。