以下是在CentOS上進行HDFS數據遷移的常用技巧及工具:
-update
參數)和保留文件屬性(-p
參數)。hadoop fs -cp
(復制)、-mv
(移動)、-put
/-get
(本地與集群間傳輸)。hdfs dfs -du -h
查看源數據規模,規劃分批遷移策略。hdfs dfs -tar
打包或rsync
工具備份關鍵數據。hadoop distcp hdfs://源集群:端口/路徑 hdfs://目標集群:端口/路徑
,可添加-overwrite
覆蓋或-update
增量復制。hadoop fs -put
將數據從本地上傳至集群,或-get
下載到本地。hdfs dfs -ls
或hdfs dfsadmin -report
。hadoop fs -ls -d
查看權限。-bandwidth
參數限制傳輸速度。參考來源: