CentOS下HDFS數據恢復主要有以下幾種方法及步驟:
利用回收站恢復
core-site.xml
中配置fs.trash.interval
(如設置為120分鐘)。/user/username/.Trash/Current/
中用hdfs dfs -mv
命令恢復文件。基于快照恢復
hdfs dfsadmin -allowSnapshot /path
和hdfs dfs -createSnapshot /path snapshotName
。hdfs dfs -restoreSnapshot /path snapshotName
或hdfs dfs -cp /path/.snapshot/snapshotName /destination
恢復。使用Hadoop工具恢復
hdfs fsck /path -files -blocks -locations
。hadoop distcp hdfs://源集群路徑 hdfs://目標集群路徑
。手動恢復(高風險)
sudo systemctl stop hadoop-namenode hadoop-datanode
。fsimage
文件到NameNode節點。注意事項:
引用來源: