安装 NVIDIA Container Toolkit 步骤指南

以下是在 CentOS 7 上安装 NVIDIA Container Toolkit 的详细步骤:

1. 设置存储库和 GPG 密钥

首先,您需要设置存储库和 GPG 密钥。请在终端执行以下命令:

1
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) && curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.repo | sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo

2. 更新包列表并安装 nvidia-container-toolkit 包

接下来,更新您的包列表并安装 nvidia-container-toolkit 包及其依赖项。

1
2
sudo yum clean expire-cache
sudo yum install -y nvidia-container-toolkit

3. 配置 Docker 守护进程以识别 NVIDIA 容器运行时

使用以下命令配置 Docker 守护进程,使其能够识别 NVIDIA 容器运行时:

1
sudo nvidia-ctk runtime configure --runtime=docker

4. 设置默认运行时并重新启动 Docker 守护进程

完成配置后,您需要设置默认运行时并重新启动 Docker 守护进程以完成安装:

1
sudo systemctl restart docker

5. 测试

最后,您可以通过运行基本 CUDA 容器来测试 NVIDIA Container Toolkit 的工作设置:

1
sudo docker run --rm --runtime=nvidia --gpus all nvidia/cuda:11.6.2-base-ubuntu20.04 nvidia-smi

您也可以加入 -L 参数,仅显示显卡信息:

1
sudo docker run --rm --runtime=nvidia --gpus all nvidia/cuda:11.6.2-base-ubuntu20.04 nvidia-smi -L
1
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \ && curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.repo | sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo

更新包列表后安装 nvidia-container-toolkit 包(和依赖项)

1
sudo yum clean expire-cache
1
sudo yum install -y nvidia-container-toolkit

配置 Docker 守护进程以识别 NVIDIA 容器运行时

1
sudo nvidia-ctk runtime configure --runtime=docker

设置默认运行时后,重新启动 Docker 守护进程以完成安装

1
sudo systemctl restart docker

测试

此时,可以通过运行基本 CUDA 容器来测试工作设置:

1
sudo docker run --rm --runtime=nvidia --gpus all nvidia/cuda:11.6.2-base-ubuntu20.04 nvidia-smi

也可以加入 -L 参数,只显示显卡:

1
sudo docker run --rm --runtime=nvidia --gpus all nvidia/cuda:11.6.2-base-ubuntu20.04 nvidia-smi -L

在这里插入图片描述