以下是在 CentOS 7 上安装 NVIDIA Container Toolkit 的详细步骤:
1. 设置存储库和 GPG 密钥
首先,您需要设置存储库和 GPG 密钥。请在终端执行以下命令:
1
|
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) && curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.repo | sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
|
接下来,更新您的包列表并安装 nvidia-container-toolkit 包及其依赖项。
1
2
|
sudo yum clean expire-cache
sudo yum install -y nvidia-container-toolkit
|
3. 配置 Docker 守护进程以识别 NVIDIA 容器运行时
使用以下命令配置 Docker 守护进程,使其能够识别 NVIDIA 容器运行时:
1
|
sudo nvidia-ctk runtime configure --runtime=docker
|
4. 设置默认运行时并重新启动 Docker 守护进程
完成配置后,您需要设置默认运行时并重新启动 Docker 守护进程以完成安装:
1
|
sudo systemctl restart docker
|
5. 测试
最后,您可以通过运行基本 CUDA 容器来测试 NVIDIA Container Toolkit 的工作设置:
1
|
sudo docker run --rm --runtime=nvidia --gpus all nvidia/cuda:11.6.2-base-ubuntu20.04 nvidia-smi
|
您也可以加入 -L
参数,仅显示显卡信息:
1
|
sudo docker run --rm --runtime=nvidia --gpus all nvidia/cuda:11.6.2-base-ubuntu20.04 nvidia-smi -L
|
1
|
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \ && curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.repo | sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
|
1
|
sudo yum clean expire-cache
|
1
|
sudo yum install -y nvidia-container-toolkit
|
配置 Docker 守护进程以识别 NVIDIA 容器运行时
1
|
sudo nvidia-ctk runtime configure --runtime=docker
|
设置默认运行时后,重新启动 Docker 守护进程以完成安装
1
|
sudo systemctl restart docker
|
测试
此时,可以通过运行基本 CUDA 容器来测试工作设置:
1
|
sudo docker run --rm --runtime=nvidia --gpus all nvidia/cuda:11.6.2-base-ubuntu20.04 nvidia-smi
|
也可以加入 -L 参数,只显示显卡:
1
|
sudo docker run --rm --runtime=nvidia --gpus all nvidia/cuda:11.6.2-base-ubuntu20.04 nvidia-smi -L
|