在Linux系統上安裝PyTorch與CUDA的步驟如下:
首先,確保你的Linux系統滿足PyTorch的系統要求。PyTorch支持的CUDA最低版本為18.04,因此建議使用Ubuntu 18.04或更高版本。
在終端中運行以下命令檢查NVIDIA顯卡驅動是否已安裝:
nvidia-smi
如果顯示CUDA版本信息,說明驅動已安裝。如果沒有安裝,請訪問NVIDIA官網下載并安裝與你的顯卡型號相匹配的驅動程序。
訪問NVIDIA CUDA Toolkit Archive,選擇與你的顯卡驅動版本相適應的CUDA版本。以下是一個示例,假設我們需要安裝CUDA 11.7:
wget https://developer.download.nvidia.com/compute/cuda/11.7.1/local_installers/cuda_11.7.1_515.65.01_linux.run
chmod +x cuda_11.7.1_515.65.01_linux.run
./cuda_11.7.1_515.65.01_linux.run
在安裝過程中,按提示操作,注意選擇自定義安裝路徑,并取消選擇“Install CUDA driver”選項,以避免覆蓋顯卡驅動。
~/.bashrc文件,添加以下行:export PATH=/usr/local/cuda-11.7/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.7/lib64:$LD_LIBRARY_PATH
保存并關閉文件,然后運行以下命令使環境變量生效:
source ~/.bashrc
nvcc -V
訪問NVIDIA cuDNN官方網站,下載與你的CUDA版本兼容的cuDNN庫。以下是一個示例,假設我們需要安裝cuDNN 8.5(對應CUDA 11.7):
wget https://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64/libcudnn8_8.5.0.50-1+cudnn8.5.0-1+cuda11.7_amd64.deb
sudo dpkg -i libcudnn8_8.5.0.50-1+cudnn8.5.0-1+cuda11.7_amd64.deb
~/.bashrc文件中:echo 'export PATH=/usr/lib/x86_64-linux-gnu:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc
在安裝PyTorch之前,建議創建一個conda虛擬環境以隔離項目依賴:
conda create -n pytorch_env python=3.9
conda activate pytorch_env
根據你的CUDA版本,從PyTorch官網獲取相應的安裝命令。以下是一個示例,假設我們需要安裝PyTorch 2.0.1(對應CUDA 11.7):
conda install pytorch torchvision torchaudio cudatoolkit=11.7 -c pytorch
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu117
在Python解釋器中運行以下代碼,檢查PyTorch是否能夠檢測到CUDA:
import torch
print(torch.__version__)
print(torch.cuda.is_available())
如果輸出為True,則表示PyTorch和CUDA適配成功。
通過以上步驟,你可以在Linux系統中成功安裝PyTorch與CUDA,從而利用GPU加速深度學習模型的訓練和推理。如果在安裝過程中遇到問題,可以參考PyTorch官方文檔或相關社區論壇尋求幫助。