一、優先收集故障基礎信息
故障排查的第一步是明確故障現象,可通過以下方式快速收集關鍵信息:
systemctl status weblogic命令確認WebLogic服務是否處于active (running)狀態;若未運行,嘗試systemctl start weblogic啟動并觀察啟動日志。$DOMAIN_HOME/servers/<server_name>/logs/目錄下(如server.log、diagnostics.log),使用tail -f server.log實時查看最新錯誤信息,或grep -i "error\|exception" server.log過濾關鍵錯誤關鍵詞(如OutOfMemoryError、ClassNotFoundException)。netstat -tulnp | grep <weblogic_port>(如7001、5556)檢查WebLogic監聽端口是否處于LISTEN狀態;若端口未監聽,可能是配置錯誤或進程未啟動;若端口被占用,通過lsof -i:<port>找到占用進程并終止(kill -9 <pid>)。二、常見故障類型及針對性解決步驟
weblogic)對$DOMAIN_HOME及子目錄有讀寫權限,使用chown -R weblogic:bea $DOMAIN_HOME修復權限;若用root啟動過,需徹底清理殘留進程(ps -ef | grep weblogic | awk '{print $2}' | xargs kill -9)并重新以weblogic用戶啟動。Address already in use,通過netstat -an | grep <port>找到占用進程,終止沖突進程或修改$DOMAIN_HOME/config/config.xml中的ListenPort(如將7001改為7002),重啟服務。java -version檢查JDK版本;若版本不符,下載并安裝正確版本的JDK,設置JAVA_HOME環境變量(export JAVA_HOME=/usr/java/jdk1.8.0_391)并更新$DOMAIN_HOME/bin/setDomainEnv.sh中的JAVA_HOME路徑。OutOfMemoryError,調整JVM內存參數(-Xms初始堆大小、-Xmx最大堆大?。?,建議設置為相同值以減少GC頻率(如-Xms1024m -Xmx1024m),修改$DOMAIN_HOME/bin/startWebLogic.sh中的JAVA_OPTIONS參數。firewall-cmd --list-ports檢查防火墻是否開放WebLogic端口(如7001),若未開放,執行firewall-cmd --add-port=7001/tcp --permanent添加規則,然后firewall-cmd --reload生效;若使用iptables,執行iptables -A INPUT -p tcp --dport 7001 -j ACCEPT并保存規則(service iptables save)。systemctl status nodemanager),確保節點管理器運行;若節點管理器日志($DOMAIN_HOME/servers/<server_name>/data/nodemanager/nodemanager.log)中出現Invalid state file format,刪除nodemanager.state文件(rm -f $DOMAIN_HOME/servers/<server_name>/data/nodemanager/nodemanager.state)并重啟節點管理器。$DOMAIN_HOME/servers/<server_name>/logs/deployments/目錄下的部署日志(如<app_name>.log),定位部署失敗原因(如DeploymentException、ClassNotFoundException)。WEB-INF/lib目錄或WebLogic的lib目錄($DOMAIN_HOME/lib)。web.xml或weblogic.xml配置文件,確保上下文路徑(context-root)、數據源引用等配置正確;若應用引用了外部數據源,確認數據源已正確配置并啟動。top命令查看CPU使用率(關注%CPU高的進程)、free -h查看內存使用情況(關注available內存)、df -h查看磁盤空間(確保/分區有足夠空間)。http://<host>:7001/console),導航至Monitoring -> Performance,查看線程池(ExecuteThreadTotalCPUUsage)、JVM內存(HeapMemoryUsage)、連接池(ExecuteThreadTotalRequests)等指標,若線程池活躍線程數接近最大值(ExecuteThreadMax),調整線程池大?。ㄔ黾?code>ExecuteThreadMax參數);若JVM堆內存使用率超過80%,調整-Xmx參數(如從1024m增加到2048m)。jstack <pid>獲取線程堆棧,分析是否有線程死鎖(deadlock關鍵詞);使用jmap -histo:live <pid>查看堆內存中的對象分布,定位內存泄漏(如大量byte[]或String對象);使用VisualVM或JProfiler進行更深入的性能分析(如方法調用耗時、內存分配情況)。三、后續優化與預防措施
$DOMAIN_HOME/config目錄下的配置文件(如config.xml、boot.properties),避免配置丟失。logrotate),避免日志文件過大占用磁盤空間(如每天生成一個日志文件,保留30天)。