以下是Kubernetes在Ubuntu上的故障排查方法:
sudo apt update && sudo apt upgrade命令。kubeadm version、kubelet --version、kubectl version檢查核心組件版本是否兼容。kubectl get nodes查看節點狀態,對NotReady節點執行kubectl describe node <節點名>分析原因。kubectl cluster-info檢查主節點及核心組件(如kube-apiserver、kube-controller-manager)是否正常。kubectl get pods --all-namespaces查看Pod狀態,對異常Pod執行kubectl describe pod <Pod名>查看事件和錯誤信息。kubectl logs <Pod名> [-c <容器名>]查看容器日志,定位應用錯誤或啟動失敗原因。docker pull <鏡像名>手動驗證鏡像可拉取性。ping、curl、traceroute測試Pod間及服務的網絡連通性。kubectl get netpol查看網絡策略,確認是否因規則限制導致通信異常。kubectl top nodes和kubectl top pods查看資源使用情況,調整Pod資源請求或擴容節點。kubectl auth can-i檢查Pod或ServiceAccount的權限,必要時添加Role/RoleBinding。journalctl -u kubelet查看kubelet服務日志,排查節點級錯誤。kubeadm reset重置集群(注意備份數據),然后重新初始化。kubectl debug命令進入Pod調試,或通過臨時容器排查運行時問題。參考來源: