nvidia-smi
是 NVIDIA 提供的一個命令行工具,用于管理和監控 NVIDIA GPU 設備。它可以幫助用戶查看 GPU 的狀態、使用情況、溫度、功耗等信息,并且可以進行一些高級設置,如調整風扇速度、功耗限制等。本文將詳細介紹 Linux 系統中常用的 nvidia-smi
命令及其用法。
要查看系統中安裝的 NVIDIA GPU 的基本信息,可以使用以下命令:
nvidia-smi
該命令會顯示 GPU 的型號、驅動版本、CUDA 版本、顯存使用情況、溫度、功耗等信息。
要查看 GPU 的使用情況,可以使用以下命令:
nvidia-smi --query-gpu=utilization.gpu --format=csv
該命令會顯示 GPU 的使用率,以百分比形式表示。
要查看 GPU 的溫度,可以使用以下命令:
nvidia-smi --query-gpu=temperature.gpu --format=csv
該命令會顯示 GPU 的當前溫度,以攝氏度表示。
要查看 GPU 的功耗,可以使用以下命令:
nvidia-smi --query-gpu=power.draw --format=csv
該命令會顯示 GPU 的當前功耗,以瓦特表示。
要查看 GPU 的顯存使用情況,可以使用以下命令:
nvidia-smi --query-gpu=memory.used --format=csv
該命令會顯示 GPU 的當前顯存使用量,以 MB 表示。
要手動設置 GPU 的風扇速度,可以使用以下命令:
nvidia-settings -a "[gpu:0]/GPUFanControlState=1"
nvidia-settings -a "[gpu:0]/GPUTargetFanSpeed=50"
第一條命令啟用風扇控制,第二條命令將風扇速度設置為 50%??梢愿鶕枰{整風扇速度。
要設置 GPU 的功耗限制,可以使用以下命令:
nvidia-smi -i 0 -pl 150
該命令將 GPU 0 的功耗限制設置為 150 瓦??梢愿鶕枰{整功耗限制。
要設置 GPU 的性能模式,可以使用以下命令:
nvidia-smi -i 0 -pm 1
該命令將 GPU 0 的性能模式設置為最大性能模式??梢愿鶕枰{整性能模式。
要查看當前正在使用 GPU 的進程信息,可以使用以下命令:
nvidia-smi pmon
該命令會顯示每個 GPU 上正在運行的進程及其資源使用情況。
要殺死某個正在使用 GPU 的進程,可以使用以下命令:
nvidia-smi -i 0 -gpu-reset
該命令會重置 GPU 0,并終止所有使用該 GPU 的進程。
要實時監控 GPU 的狀態,可以使用以下命令:
watch -n 1 nvidia-smi
該命令會每隔 1 秒刷新一次 GPU 的狀態信息。
要生成 GPU 的日志文件,可以使用以下命令:
nvidia-smi -q -x > gpu_log.xml
該命令會將 GPU 的詳細信息以 XML 格式保存到 gpu_log.xml
文件中。
如果 nvidia-smi
命令沒有顯示任何 GPU 信息,可能是驅動未正確安裝或 GPU 未正確連接??梢試L試以下步驟:
檢查驅動是否安裝正確:
nvidia-smi
如果命令未找到,可能需要重新安裝驅動。
檢查 GPU 是否連接正確:
lspci | grep -i nvidia
如果未顯示任何信息,可能需要檢查硬件連接。
如果 GPU 使用率異常高或低,可能是由于某些進程占用了大量資源??梢允褂靡韵旅畈榭催M程信息:
nvidia-smi pmon
然后根據進程 ID 終止不必要的進程。
如果 GPU 溫度過高,可以嘗試以下步驟:
增加風扇速度:
nvidia-settings -a "[gpu:0]/GPUTargetFanSpeed=70"
降低 GPU 功耗限制:
nvidia-smi -i 0 -pl 120
檢查散熱系統是否正常工作。
nvidia-smi
是一個非常強大的工具,可以幫助用戶管理和監控 NVIDIA GPU 設備。通過本文介紹的命令,用戶可以輕松查看 GPU 的狀態、使用情況、溫度、功耗等信息,并且可以進行一些高級設置,如調整風扇速度、功耗限制等。希望本文能幫助讀者更好地理解和使用 nvidia-smi
命令。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。