CentOS上排查HBase故障可按以下步驟進行:
/var/log/hbase/
目錄下的日志文件(如hbase-hbase-master-*.log
),搜索ERROR
、WARN
等關鍵字。jps
或ps -ef | grep hbase
確認HMaster、HRegionServer等進程是否正常運行。hbase-site.xml
、hbase-env.sh
中參數(如hbase.rootdir
、JAVA_HOME
)設置正確。JAVA_HOME
、HBASE_HOME
等環境變量已正確配置。netstat
或ss
檢查HBase端口(如16010、16020)是否開放,用ping
、traceroute
測試網絡連通性。hdfs dfsadmin -report
查看HDFS健康狀況,確保數據目錄可寫且磁盤空間充足。top
、free -m
、df -h
檢查CPU、內存、磁盤資源是否充足。hbase hbck
:檢查并修復元數據不一致、Region分配異常等問題。hbase shell
:通過status 'detailed'
等命令查看集群狀態。hbase-env.sh
參數。hbase hbck -fix
系列命令修復。參考來源: