在Ubuntu上調度Hadoop作業通常涉及以下幾個步驟:
core-site.xml
, hdfs-site.xml
, yarn-site.xml
, 和 mapred-site.xml
文件。yarn jar
命令提交MapReduce作業。例如:yarn jar your-job.jar com.yourcompany.YourJobClass input output
其中 your-job.jar
是你的作業JAR文件,com.yourcompany.YourJobClass
是主類,input
是輸入數據路徑,output
是輸出數據路徑。http://<ResourceManager-Host>:8088/cluster
。yarn application
命令來查詢作業狀態,例如:yarn application -list
yarn application -status <application-id>
crontab -e
0 0 * * * /path/to/hadoop jar /path/to/your-job.jar com.yourcompany.YourJobClass /input/path /output/path
請注意,Hadoop的版本和發行版可能會影響具體的命令和配置步驟,因此建議參考你所使用的Hadoop版本的官方文檔來獲取最準確的信息。