在CentOS上使用GPU加速PyTorch,你需要確保你的系統滿足以下條件:
以下是詳細步驟:
首先,你需要安裝適用于你的GPU的NVIDIA驅動程序。你可以從NVIDIA官方網站下載最新的驅動程序。
# 添加EPEL倉庫
sudo yum install epel-release
# 安裝NVIDIA驅動程序
sudo yum install nvidia-driver-latest-dkms
重啟系統以應用驅動程序:
sudo reboot
驗證驅動程序是否安裝成功:
nvidia-smi
從NVIDIA官方網站下載適用于你的GPU和操作系統的CUDA Toolkit。以下是一個示例命令,用于安裝CUDA 11.7:
# 下載CUDA Toolkit 11.7
wget https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda_11.7.0_515.43.04_linux.run
# 運行安裝程序
sudo sh cuda_11.7.0_515.43.04_linux.run
# 按照提示完成安裝
安裝完成后,添加CUDA路徑到環境變量:
echo 'export PATH=/usr/local/cuda-11.7/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-11.7/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc
驗證CUDA是否安裝成功:
nvcc --version
從NVIDIA官方網站下載適用于你的CUDA版本的cuDNN庫。以下是一個示例命令,用于安裝cuDNN 8.2.2:
# 下載cuDNN 8.2.2 for CUDA 11.7
wget https://developer.nvidia.com/compute/machine-learning/cudnn/secure/8.2.2/11.7_20210301/cudnn-11.7-linux-x64-v8.2.2.26.tgz
# 解壓文件
tar -xzvf cudnn-11.7-linux-x64-v8.2.2.26.tgz
# 復制文件到CUDA目錄
sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
你可以使用pip安裝支持CUDA的PyTorch版本。以下是一個示例命令,用于安裝PyTorch 1.10.0:
# 安裝PyTorch 1.10.0 with CUDA 11.7
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu117
驗證PyTorch是否支持GPU:
import torch
print(torch.cuda.is_available())
print(torch.cuda.current_device())
print(torch.cuda.get_device_name(torch.cuda.current_device()))
如果輸出顯示GPU可用并且設備名稱正確,那么你已經成功在CentOS上使用GPU加速PyTorch。
通過這些步驟,你應該能夠在CentOS上成功配置和使用GPU加速PyTorch。