記錄故障的具體表現(如數據庫無法啟動、查詢響應緩慢、報錯信息等),包括錯誤代碼(如SQLCODE)、發生時間及觸發條件(如特定操作后出現)。嘗試在測試環境重現問題,縮小故障范圍。
dmesg
查看內核日志,檢查硬件(如磁盤、內存)或驅動程序錯誤;/var/log/messages
、/var/log/syslog
或/var/log/auth.log
(CentOS),獲取系統級錯誤信息(如服務啟動失敗、權限問題);journalctl -xe
(systemd系統)查看實時系統日志。onstat -l
查看邏輯日志狀態(是否滿、使用情況);onstat -x
檢查事務的邏輯日志起始位置,定位長事務;/opt/IBM/informix/log/server.log
或/var/log/informix/
),獲取數據庫內部錯誤詳情。使用oninit -v
檢查數據庫是否正常初始化(共享內存是否加載),若未初始化,嘗試手動啟動:onmode -c startup
。
使用onstat -
系列命令監控狀態:
onstat -c
:查看CPU使用及進程信息;onstat -m
:查看內存使用(緩沖池、鎖等);onstat -d
:查看磁盤I/O及數據庫空間使用;onstat -s
:查看SQL執行統計(慢查詢、執行次數);onstat -g ses
:查看當前會話信息(鎖等待、阻塞情況)。使用onmode
命令調整數據庫狀態:
onmode -c status
:檢查數據庫當前狀態(在線、離線);onmode -z
:緊急模式下修復數據庫(需謹慎使用);onmode -m
:切換到多用戶模式(正常運行)。onconfig
)、依賴服務未啟動(如網絡、磁盤)。setenforce 0
,重啟Informix驗證;onconfig
文件(如$INFORMIXDIR/etc/onconfig
)中的參數(內存分配、磁盤路徑);df -h
檢查磁盤空間,free -m
檢查內存是否充足。onstat -x
查看事務日志起始位置);onparams -a -d <DBspace> -s <size> -i
添加新日志文件;onstat -l
確認日志文件后,執行ontape -s -L 0
備份并截斷日志。onstat -u
查看鎖等待會話,onstat -g ses
分析阻塞鏈;onmode -z <session_id>
(謹慎使用);df -h
檢查磁盤空間,清理不必要的文件(如日志、臨時文件);iostat -x 1
監控磁盤I/O,檢查磁盤是否故障(如高await
、%util
);informix
)對數據目錄有讀寫權限(chown -R informix:informix /opt/IBM/informix/data
)。onstat -c
查看CPU熱點(如高CPU的會話或進程);onstat -m
分析內存使用(如緩沖池命中率低,需調整BUFFERS
參數);onstat -d
檢查磁盤I/O(如某chunk讀寫慢,需遷移至更快磁盤);dbaccess
執行EXPLAIN
分析慢查詢,添加索引或重寫SQL。onstat
:核心監控工具,覆蓋CPU、內存、磁盤、SQL等全維度指標;oncheck
:檢查數據庫一致性(oncheck -pt <database>
檢查表結構,oncheck -pu <database>
修復碎片)。top/htop
:實時查看進程資源占用(CPU、內存);vmstat 1
:監控虛擬內存(si
/so
表示磁盤交換頻繁,需調整內存);iostat -x 1
:監控磁盤I/O(await
表示平均I/O等待時間,%util
表示磁盤利用率);netstat -tulnp
:查看網絡連接(如端口是否監聽、連接數是否過多)。onstat
數據并可視化,設置性能閾值告警;修復后,通過onstat
命令確認狀態恢復正常(如邏輯日志空間充足、鎖等待消失、磁盤I/O正常),并通過簡單查詢(如SELECT 1 FROM systables
)驗證數據庫可用性。
ontape
或onbar
工具備份數據庫,測試備份恢復流程;df -h | awk '$5 > 90 {print}'
);onstat -g ckp
檢查檢查點狀態,每月執行oncheck
檢查數據庫一致性,每季度優化索引(ALTER INDEX ... REBUILD
);