CUDA版本不匹配
nvidia-smi和nvcc --version確認系統CUDA版本。# 例如CUDA 11.7對應的PyTorch安裝命令
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu117
```。
export CUDA_HOME=/usr/local/cuda-<版本號>
export PATH=$CUDA_HOME/bin:$PATH
export LD_LIBRARY_PATH=$CUDA_HOME/lib64:$LD_LIBRARY_PATH
```。
依賴庫缺失或沖突
numpy、scipy等依賴庫,或版本沖突。pip install numpy scipy。conda管理環境,避免全局依賴沖突:conda create -n pytorch_env python=3.8
conda activate pytorch_env
conda install pytorch torchvision torchaudio cudatoolkit=<版本號>
```。
Python版本不兼容
python3 -m venv pytorch_env
source pytorch_env/bin/activate
```。
權限或安裝錯誤
pip install時出現權限不足或網絡超時。sudo提升權限,或通過國內鏡像源加速下載:pip install --user torch torchvision -i https://pypi.tuna.tsinghua.edu.cn/simple
```。
運行時設備錯誤
print(torch.cuda.is_available()),返回True則配置正確。device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = model.to(device)
data = data.to(device)
```。
驅動與CUDA工具包沖突
nvidia-smi檢查驅動版本,或從NVIDIA官網下載對應驅動安裝包。內存不足或顯存溢出
batch_size或使用梯度累積。del tensor,并調用torch.cuda.empty_cache()。版本兼容性導致的API錯誤
pip install torch==<舊版本號>回退版本。import torch
print(torch.__version__) # 查看PyTorch版本
print(torch.cuda.is_available()) # 檢查GPU是否可用
```。
sudo yum update,確保依賴庫為最新版本。參考來源: