Ubuntu Oracle集群故障可按以下步驟處理:
ORACLE_BASE/diag/rdbms/dbname/instance_name/trace
,使用SELECT * FROM vdiag_info WHERE name = 'Default Trace File';
獲取默認日志文件。top
、df
、free
等命令確認內存、磁盤、CPU使用正常。ping
、traceroute
、netstat
測試節點間通信,確保監聽器狀態正常(lsnrctl status
)。SHOW PARAMETERS
檢查SGA、PGA等配置是否正確,確認參數文件(spfile/init.ora)無損壞。ocrconfig
恢復OCR備份,或通過dd
命令修復表決盤。crsctl delete node -n <主機名> -f
從集群中移除,剩余節點以單實例模式運行。RMAN
進行恢復;VIP漂移時手動調整監聽配置。關鍵操作前:建議先備份集群配置(如OCR、數據庫文件),操作后驗證服務可用性并監控性能。