Proxmox VE(PVE) 下直通GPU给LXC

博主： Zimri
发布时间：2023 年 03 月 24 日
8034 次浏览
暂无评论
9580字数
分类： ProxmoxVE

GPU 直通已成为PVE下获取GPU性能的最佳方案，但独占模式使得GPU变得很局限；比如我有俩个VPS都需要使用GPU，那么加入俩张物理显卡进行分配

当然使用Proxmox VE(PVE)虚拟化的GPU可以通过以下几种方案来实现

intel GVT-g
Nvida vGPU
GPU Passthrough
Docker-Nvidia

相对来说还是比较灵活，当然每种方案都有利有弊这里会简要的总结一下特点:

方案	性能	运行模式	成本
intel GVT-g	最低(intel集成显卡)	多台VPS可同时使用	低(随有核显CPU的得到)
Nvida vGPU	高(可控)	多台VPS可同时使用	昂贵且vGPU需商业授权
GPU Passthrough	高(视显卡型号)	独占1台VPS来使用	按需购买独立显卡
Docker-Nvidia	较高(视显卡型号)	宿主独占多Docker同时使用	按需购买独立显卡

同时还有一些细节问题需要是注意：

intel GVT-g 技术有最大并发限制大约在1-4数量之间具体视CPU规格
Nvida vGPU 无数量限制但商业授权按个数授权
GPU Passthrough 游戏显卡并发数限制为3个专业图形卡和服务器卡则没有限制
Docker-Nvidia 和下面即将介绍的LXC 方案受限为物理卡限制

可以通过查看 Nvidia NVDEC 来获得大多数N卡的详细信息

通过 Nvidia NVDEC信息表得知我所需的环境性价比最好的应该是 P2200 所以我选择了它

小规模团队、工作室、家庭、个人来说一块放进服务器中的GPU当然希望他的性能能接近100%榨干；

当然还有微软平台的Hyper-V 也有不错的 GPU虚拟化方案，只是驱动兼容和配置修改较为复杂这里直接排除；

所以这里就出现了直通GPU给LXC 容器的解决方案，这个方案的特点和Docker-Nvidia 类似，只是LXC容器的特性使得容器更接近VPS环境，配合 Proxmox VE(PVE) 可以说在大多数架构上来使用体验接近VPS环境了；

部署步骤

宿主机操作部分

更新源参考这里
[[Proxmox VE 配置源及关闭订阅提醒]]

然后更新库。

apt-get update -y
apt-get dist-upgrade -y

安装header

Proxmox VE(PVE) 有个命令可直接安装header 无需查询

apt update
apt install pve-headers -y

使用这个命令安装的下面步骤省略

如需手动查询安装：
通过uname -a 查询自己的内核。
然后，apt-cache search pve-header 查询跟自己内核版本一样的header

注意这里说的是pve-header 而不是linux-header
然后 apt install pve-headers-5.11.22-4-pve这个是我的，PVE7下的具体要把 install 后面的内容换自己实际的版本号。

环境准备

安装一下驱动安装所需要的环境

apt update -y
apt install dkms -y

然后再确认一下，GPU插上了，并且能准确显示：

lspci | grep -i nvidia

您应该会看到如下输出：

01:00.0 VGA compatible controller: NVIDIA Corporation GP106GL [Quadro P2200] (rev a1)
01:00.1 Audio device: NVIDIA Corporation GP106 High Definition Audio Controller (rev a1)

安装显卡驱动

PVE7

apt-get update
apt-get install -t bullseye-backports nvidia-driver nvidia-smi

PVE6

apt-get update
apt-get install -t buster-backports nvidia-driver nvidia-smi

添加模块

驱动无错安装之后，注意检查以下目录内容

ls /etc/modules-load.d/*

我这里返回 3个文件

/etc/modules-load.d/modules.conf 
/etc/modules-load.d/qemu-server.conf
/etc/modules-load.d/nvidia.conf

查看cat /etc/modules-load.d/nvidia.conf文件内容：

nvidia-drm

向nvidia.conf中添加模块，确保文件内容如下：

nvidia-drm
nvidia
nvidia_uvm

注意：

因PVE版本和驱动差异注意检查/etc/modules-load.d/ 每一个文件内容，保证添加的模块不能少，也不能重复；
如果没有nvidia.conf 则吧上面的内容添加到/etc/modules-load.d/modules.conf 文件中

屏蔽不兼容驱动

查看目录

ls /etc/modprobe.d/*

/etc/modprobe.d/dkms.conf 
/etc/modprobe.d/nvidia-kernel-common.conf
/etc/modprobe.d/nvidia-blacklists-nouveau.conf  
/etc/modprobe.d/pve-blacklist.conf
/etc/modprobe.d/nvidia.conf

检查 cat /etc/modprobe.d/nvidia-blacklists-nouveau.conf 和 /etc/modprobe.d/pve-blacklist.conf 文件确保里面内容包含

blacklist nouveau
blacklist nvidiafb

保证内容没有被注释同时也不能重复

更新模块

UEFI模式安装的PVE使用命令：

update-initramfs -u -k all

兼容模式或传统模式安装的使用：

update-grub

没把握的俩个都运行一下

创建规则

创建一个文件 nano /etc/udev/rules.d/70-nvidia.rules并填充：

# Create /nvidia0, /dev/nvidia1 … and /nvidiactl when nvidia module is loaded
KERNEL=="nvidia", RUN+="/bin/bash -c '/usr/bin/nvidia-smi -L && /bin/chmod 666 /dev/nvidia*'"
# Create the CUDA node when nvidia_uvm CUDA module is loaded
KERNEL=="nvidia_uvm", RUN+="/bin/bash -c '/usr/bin/nvidia-modprobe -c0 -u && /bin/chmod 0666 /dev/nvidia-uvm*'"

这些规则作用：

设置更宽松的权限
启用默认情况下未启动的 nvidia_uvm（至少对于我的卡而言）

重启

reboot

期待一个没有报错、没有宕机、没有BUG的醒来

检查

重新启动主机，并检查的输出ls -al /dev/nvidia*，并ls -al /dev/dri/*为类似下面：

crw-rw-rw- 1 root root 195, 0 Feb 11 18:11 /dev/nvidia0
crw-rw-rw- 1 root root 195, 255 Feb 11 18:11 /dev/nvidiactl
crw-rw-rw- 1 root root 195, 254 Feb 11 18:11 /dev/nvidia-modeset
crw-rw-rw- 1 root root 236, 0 Feb 11 18:11 /dev/nvidia-uvm
crw-rw-rw- 1 root root 236, 1 Feb 11 18:11 /dev/nvidia-uvm-tools

crw-rw---- 1 root video 226, 0 May 1 17:43 /dev/dri/card0
crw-rw---- 1 root video 226, 1 May 1 17:43 /dev/dri/card1
crw-rw---- 1 root render 226, 128 May 1 17:43 /dev/dri/renderD128

记下号码的第五列以上195，236并226分别。这些是之后LXC中需要的。
注意： 上述设备缺一不可至少包含：nvidia0、nvidiactl、nvidia-modeset、vidia-uvm、nvidia-uvm-tools；少了说明驱动有组件没有安装成功，请详细检查；

此外，您可以使用nvidia-smi应该显示类似内容的命令检查 nvidia 卡是否正在工作

LXC操作部分

接下来，我们需要在容器内安装 Nvidia 驱动程序。Proxmox 主机和容器之间的确切 Nvidia 驱动程序版本匹配非常重要！

Debian(ProxmoxVE) 使用较旧的 Nvidia 驱动程序460.91.03，因此我必须在我的 LXC Linux 容器中也需要手动安装对应版本的Nvidia 驱动程序。

下载驱动程序

LXC开机，进入LXC中下载驱动程序
注意：LXC容器只能为非特权容器
直接穷举出URL：

wget https://us.download.nvidia.com/XFree86/Linux-x86_64/460.91.03/NVIDIA-Linux-x86_64-460.91.03.run

在没有内核模块的情况下执行安装：

chmod +x NVIDIA-Linux-x86_64-460.91.03.run
bash  NVIDIA-Linux-x86_64-460.91.03.run --no-kernel-module

安装成功无报错就关闭LXC

修改LXC配置文件

宿主机进入/etc/pve/lxc/ 找到对应LXC的ID配置文件nano打开在最后一行加入一下内容：

lxc.cgroup.devices.allow: c 195:* rwm
lxc.cgroup.devices.allow: c 236:* rwm
lxc.cgroup.devices.allow: c 226:* rwm
lxc.mount.entry: /dev/nvidia0 dev/nvidia0 none bind,optional,create=file
lxc.mount.entry: /dev/nvidiactl dev/nvidiactl none bind,optional,create=file
lxc.mount.entry: /dev/nvidia-uvm dev/nvidia-uvm none bind,optional,create=file
lxc.mount.entry: /dev/nvidia-modeset dev/nvidia-modeset none bind,optional,create=file
lxc.mount.entry: /dev/nvidia-uvm-tools dev/nvidia-uvm-tools none bind,optional,create=file
lxc.mount.entry: /dev/dri dev/dri none bind,optional,create=dir

其中 195，236和226 数字是上面记录的，注意按实际更换填写

修改好保存，开机
登陆LXC 输入命令 nvidia-smi
返回

应用实例

LXC GPU容器中安装Emby

LXC GPU直通的特性，LXC容器只能为非特权容器直通
如果是特权容器启动运行 nvidia-smi会返回

Failed to initialize NVML: Unknown Error

这个特性问题无解，官方无解、Hack无解；
同时，又因为非特权容器 的特性，无法从容器中使用 SMB/CIFS NFS 协议来链接外部存储。

使用以上架构的各位极客，多半存储位于外部NAS中的分布式；所以这里还需解决媒体目录挂载到LXC容器中问题，值得庆幸的是PromoxVE(PVE) 在WebUI中给予了大家一个非常有用的目录挂载功能，下面就来一一部署。

下载emby安装文件

官方下载地址

安装emby server

例下载的文件为emby-server-deb_4.6.4.0_amd64.deb
先授执行权限

chmod +x emby-server-deb_4.6.4.0_amd64.deb

然后执行安装

dpkg -i emby-server-deb_4.6.4.0_amd64.deb

设置emby

打开浏览器 http://localhost:8096 执行设置；
设置过程略过，注意其中设置媒体库的时候跳过不设置。

设置转码

安装初始设置后，进入管理后台：转码 - 启用硬件加速 -开启

此步骤主要是校验LXC容器中的GPU

解决NAS挂载

这步最为重要，按照目前的 LXC/LXD 容器技术来看，要在非特权容器中直接解决这个问题是没有办法的，各位极客如果时间宝贵就不要尝试了，当然折腾精神永不灭，如果你在非特权容器中找到直接挂载SMB/CIFS的方法请务必分享一下。

这里分享一下折腾案例，非特权容器中使用 smbclient 是可以访问到 NAS 的，这里会造成错觉。这并不意味着mount -t cifs or mount.cifs 能正确挂载

所以就是如此的无奈，非特权才能"vGPU"。特权才能SMB/CIFS

好在还有一个办法能非常巧妙的平衡这个不足，思路为：

Proxmox VE(PVE)宿主机挂载NAS目录 - LXC 非特权容器挂载宿主机中目录

说到这里可能意识了到了LXC 非特权容器挂载宿主机中目录 为
上一步Proxmox VE(PVE)宿主机挂载NAS的目录

接下来实践：
打开 WebUI 定位到 数据中心-存储-添加-SMB/CIFS

添加一个存储

选项	值	解释
ID	video-nas	SMB/CIFS的ID 这个名称会作为宿主机内文件夹名称
服务器	10.10.200.50	NAS的内网IP地址
用户名	movide	NAS共享目录的用户
密码		NAS共享目录的密码

填写完上面的信息之后 Share 选项才能被激活，打开Share选项里面就是NAS的目录

除了服务器、用户名、密码、Share 4个选项其余配置可以参考我的设置，其中启用是关闭的，这个操作主要为了不让这个目录显示在ProxmoxVE WebGUI中，就不显的那么凌乱了

确定配置无误即可添加

添加之后可以通过路径/目标获得NAS目录在宿主机中挂载位置，并记录下它
例如我的是 /mnt/pve/video-nas

最后关闭正在运行的LXC，然后只需要用下面的命令挂载这个目录到GPU LXC中：

pct set 100 -mp0 /mnt/pve/video-nas,mp=/video

命令解释：挂载宿主机目录/mnt/pve/video-nas到 ID为100 LXC容器中的/video目录下

目录权限

问题一：
可能会遇到 LXC 容器中 /video目录只能读取不能写入的问题，需要从一下几点进行尝试：

1. NAS 账号权限

NAS账号是否已经对共享目录给予了读写权限

2. 宿主机目录权限

可以尝试使用命令来修复权限

 chmod 755 /mnt/pve/video-nas

4. LXC目录权限

 chmod 755 /video

问题二：
emby server对挂载来的目录没有写入权限

4. LXC 目录权限

 chown -R emby:emby  /video

LXC GPU容器中安装Plex

方法请类推，基本一致

LXC GPU容器中安装Jellyfin

方法请类推，基本一致

参考资料：

GPU (Nvidia) passthrough on Proxmox LXC container

Nvidia GPU passthrough in LXC

【亿点笔记】Proxmox VE(PVE) 下直通GPU给LXC 进行CUDA coding

最后修改：2024 年 01 月 21 日

如果觉得我的文章对你有用，请随意赞赏

发表评论取消回复
使用Cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

评论 *

私密评论

名称 *

🎲

邮箱 *

地址

大名鼎鼎的匿名人士
老师太棒了，为你点赞
zeruns
很实用的教程
初服
假如网卡1是SRIOV的并且连接的交换机端口配置的trunk ...
Owaii
哈哈哈，这个SSH好好玩的样子，给辛苦的服务器调试增加一点点乐趣😁
在家赚钱
看不懂呢。

Proxmox VE(PVE) 下直通GPU给LXC

Zimri • 2023 年 03 月 24 日

<p>GPU 直通已成为PVE下获取GPU性能的最佳方案，但独占模式使得GPU变得很局限；比如我有俩个VPS都需要使用GPU，那么加入俩张物理显卡进行分配</p><p>当然使用Proxmox VE(PVE)虚拟化的GPU可以通过以下几种方案来实现</p><ul><li>intel GVT-g</li><li>Nvida vGPU</li><li>GPU Passthrough</li><li>Docker-Nvidia</li></ul><p>相对来说还是比较灵活，当然每种方案都有利有弊这里会简要的总结一下特点:</p><table><thead><tr><th align="left">方案</th><th align="left">性能</th><th align="left">运行模式</th><th align="left">成本</th></tr></thead><tbody><tr><td align="left">intel GVT-g</td><td align="left">最低(intel集成显卡)</td><td align="left">多台VPS可同时使用</td><td align="left">低(随有核显CPU的得到)</td></tr><tr><td align="left">Nvida vGPU</td><td align="left">高(可控)</td><td align="left">多台VPS可同时使用</td><td align="left">昂贵且vGPU需商业授权</td></tr><tr><td align="left">GPU Passthrough</td><td align="left">高(视显卡型号)</td><td align="left">独占1台VPS来使用</td><td align="left">按需购买独立显卡</td></tr><tr><td align="left">Docker-Nvidia</td><td align="left">较高(视显卡型号)</td><td align="left">宿主独占 多Docker同时使用</td><td align="left">按需购买独立显卡</td></tr></tbody></table><p>同时还有一些细节问题需要是注意：</p><ul><li>intel GVT-g 技术有最大并发限制大约在1-4数量之间具体视CPU规格</li><li>Nvida vGPU 无数量限制 但商业授权按个数授权</li><li>GPU Passthrough 游戏显卡并发数限制为3个 专业图形卡和服务器卡则没有限制</li><li>Docker-Nvidia 和下面即将介绍的LXC 方案受限为物理卡限制</li></ul><p>可以通过查看 <span class="external-link"><a class="no-external-link" href="https://developer.nvidia.com/video-encode-decode-gpu-support-matrix" target="_blank"><i data-feather="external-link"></i>Nvidia NVDEC</a></span> 来获得大多数N卡的详细信息</p><blockquote>通过 Nvidia NVDEC信息表 得知我所需的环境性价比最好的应该是 P2200 所以我选择了它</blockquote><p>小规模团队、工作室、家庭、个人来说 一块放进服务器中的GPU当然希望他的性能能接近100%榨干；</p><p>当然还有微软平台的Hyper-V 也有不错的 GPU虚拟化方案，只是驱动兼容和配置修改较为复杂这里直接排除；</p><p>所以这里就出现了 直通GPU给LXC 容器的解决方案，这个方案的特点和<strong>Docker-Nvidia</strong> 类似，只是LXC容器的特性使得容器更接近VPS环境，配合 Proxmox VE(PVE) 可以说在大多数架构上来使用体验接近VPS环境了；</p><p><img src="https://assets.insilen.com/pic/2024/01/0119174733.png" alt="" title="" style=""></p><h2>部署步骤</h2><h3>宿主机操作部分</h3><p>更新源参考这里<br>[[Proxmox VE 配置源及关闭订阅提醒]]</p><p>然后更新库。</p><pre><code class="lang-shell">apt-get update -y
apt-get dist-upgrade -y</code></pre><h4>安装header</h4><p>Proxmox VE(PVE) 有个命令可直接安装header 无需查询</p><pre><code class="lang-shell">apt update
apt install pve-headers -y</code></pre><p>使用这个命令安装的下面步骤省略</p><p>如需手动查询安装：<br>通过<code>uname -a</code> 查询自己的内核。<br>然后，<code>apt-cache search pve-header</code> 查询跟自己内核版本一样的<code>header</code></p><p>注意这里说的是<code>pve-header</code> 而不是<code>linux-header</code><br>然后 <code>apt install pve-headers-5.11.22-4-pve</code>这个是我的，PVE7下的具体要把 <code>install</code> 后面的内容换自己实际的版本号。</p><h4>环境准备</h4><p>安装一下驱动安装所需要的环境</p><pre><code class="lang-shell">apt update -y
apt install dkms -y</code></pre><p>然后再确认一下，GPU插上了，并且能准确显示：</p><pre><code class="lang-shell">lspci | grep -i nvidia</code></pre><p>您应该会看到如下输出：</p><pre><code class="lang-shell">01:00.0 VGA compatible controller: NVIDIA Corporation GP106GL [Quadro P2200] (rev a1)
01:00.1 Audio device: NVIDIA Corporation GP106 High Definition Audio Controller (rev a1)</code></pre><h4>安装显卡驱动</h4><p>PVE7</p><pre><code class="lang-shell">apt-get update
apt-get install -t bullseye-backports nvidia-driver nvidia-smi</code></pre><p>PVE6</p><pre><code class="lang-shell">apt-get update
apt-get install -t buster-backports nvidia-driver nvidia-smi </code></pre><h4>添加模块</h4><p>驱动无错安装之后，注意检查以下目录内容</p><pre><code class="lang-shell">ls /etc/modules-load.d/*</code></pre><p>我这里返回 3个文件</p><pre><code class="lang-shell">/etc/modules-load.d/modules.conf 
/etc/modules-load.d/qemu-server.conf
/etc/modules-load.d/nvidia.conf</code></pre><p>查看<code>cat /etc/modules-load.d/nvidia.conf</code>文件内容：</p><pre><code class="lang-shell">nvidia-drm</code></pre><p>向<code>nvidia.conf</code>中添加模块，确保文件内容如下：</p><pre><code class="lang-shell">nvidia-drm
nvidia
nvidia_uvm </code></pre><p><strong>注意：</strong></p><ul><li>因PVE版本和驱动差异 注意检查<code>/etc/modules-load.d/</code> 每一个文件内容，保证添加的模块不能少，也不能重复；</li><li>如果没有<code>nvidia.conf</code> 则吧上面的内容添加到<code>/etc/modules-load.d/modules.conf </code>文件中</li></ul><h4>屏蔽不兼容驱动</h4><p>查看目录</p><pre><code class="lang-shell">ls /etc/modprobe.d/*</code></pre><p>返回</p><pre><code class="lang-shell">/etc/modprobe.d/dkms.conf 
/etc/modprobe.d/nvidia-kernel-common.conf
/etc/modprobe.d/nvidia-blacklists-nouveau.conf  
/etc/modprobe.d/pve-blacklist.conf
/etc/modprobe.d/nvidia.conf</code></pre><p>检查  <code>cat /etc/modprobe.d/nvidia-blacklists-nouveau.conf  </code> 和 <code>/etc/modprobe.d/pve-blacklist.conf</code> 文件确保里面内容包含</p><pre><code class="lang-shell">blacklist nouveau
blacklist nvidiafb</code></pre><p>保证内容没有被注释 同时 也<strong>不能重复</strong></p><h4>更新模块</h4><p>UEFI模式安装的PVE使用命令：</p><pre><code class="lang-shell">update-initramfs -u -k all</code></pre><p>兼容模式或传统模式安装的使用：</p><pre><code class="lang-shell">update-grub</code></pre><p>没把握的俩个都运行一下</p><h4>创建规则</h4><p>创建一个文件 <code>nano /etc/udev/rules.d/70-nvidia.rules</code>并填充：</p><pre><code class="lang-shell"># Create /nvidia0, /dev/nvidia1 … and /nvidiactl when nvidia module is loaded
KERNEL==&quot;nvidia&quot;, RUN+=&quot;/bin/bash -c &#039;/usr/bin/nvidia-smi -L &amp;&amp; /bin/chmod 666 /dev/nvidia*&#039;&quot;
# Create the CUDA node when nvidia_uvm CUDA module is loaded
KERNEL==&quot;nvidia_uvm&quot;, RUN+=&quot;/bin/bash -c &#039;/usr/bin/nvidia-modprobe -c0 -u &amp;&amp; /bin/chmod 0666 /dev/nvidia-uvm*&#039;&quot;</code></pre><p>这些规则作用：</p><ul><li>设置更宽松的权限</li><li>启用默认情况下未启动的 nvidia_uvm（至少对于我的卡而言）</li></ul><h4>重启</h4><pre><code class="lang-shell">reboot</code></pre><p>期待一个没有报错、没有宕机、没有BUG的醒来</p><h4>检查</h4><p>重新启动主机，并检查的输出<code>ls -al /dev/nvidia*</code>，并<code>ls -al /dev/dri/*</code>为类似下面：</p><pre><code class="lang-shell">crw-rw-rw- 1 root root 195, 0 Feb 11 18:11 /dev/nvidia0
crw-rw-rw- 1 root root 195, 255 Feb 11 18:11 /dev/nvidiactl
crw-rw-rw- 1 root root 195, 254 Feb 11 18:11 /dev/nvidia-modeset
crw-rw-rw- 1 root root 236, 0 Feb 11 18:11 /dev/nvidia-uvm
crw-rw-rw- 1 root root 236, 1 Feb 11 18:11 /dev/nvidia-uvm-tools

crw-rw---- 1 root video 226, 0 May 1 17:43 /dev/dri/card0
crw-rw---- 1 root video 226, 1 May 1 17:43 /dev/dri/card1
crw-rw---- 1 root render 226, 128 May 1 17:43 /dev/dri/renderD128</code></pre><p>记下号码的第五列以上<code>195</code>，<code>236</code>并<code>226</code>分别。这些是之后LXC中需要的。<br><strong>注意：</strong>  上述设备缺一不可至少包含：nvidia0、nvidiactl、nvidia-modeset、vidia-uvm、nvidia-uvm-tools； 少了说明驱动有组件没有安装成功，请详细检查；</p><p>此外，您可以使用<code>nvidia-smi</code>应该显示类似内容的命令检查 nvidia 卡是否正在工作<br><img src="https://assets.insilen.com/pic/2024/01/0119174814.png" alt="" title="" style=""></p><h3>LXC操作部分</h3><p>接下来，我们需要在容器内安装 Nvidia 驱动程序。Proxmox 主机和容器之间的确切 Nvidia 驱动程序版本匹配非常重要！</p><p>Debian(ProxmoxVE) 使用较旧的 Nvidia 驱动程序<code>460.91.03</code>，因此我必须在我的 LXC Linux 容器中也需要手动安装 对应版本的Nvidia 驱动程序。</p><h4>下载驱动程序</h4><p>LXC开机，进入LXC中 下载驱动程序<br><strong>注意：LXC容器只能为 非特权容器</strong><br>直接穷举出URL：</p><pre><code class="lang-shell">wget https://us.download.nvidia.com/XFree86/Linux-x86_64/460.91.03/NVIDIA-Linux-x86_64-460.91.03.run</code></pre><p>在没有内核模块的情况下执行安装：</p><pre><code class="lang-shell">chmod +x NVIDIA-Linux-x86_64-460.91.03.run
bash  NVIDIA-Linux-x86_64-460.91.03.run --no-kernel-module</code></pre><p>安装成功无报错就关闭LXC</p><h5>修改LXC配置文件</h5><p>宿主机进入<code>/etc/pve/lxc/</code> 找到对应LXC的ID配置文件nano打开 在最后一行加入一下内容：</p><pre><code class="lang-shell">lxc.cgroup.devices.allow: c 195:* rwm
lxc.cgroup.devices.allow: c 236:* rwm
lxc.cgroup.devices.allow: c 226:* rwm
lxc.mount.entry: /dev/nvidia0 dev/nvidia0 none bind,optional,create=file
lxc.mount.entry: /dev/nvidiactl dev/nvidiactl none bind,optional,create=file
lxc.mount.entry: /dev/nvidia-uvm dev/nvidia-uvm none bind,optional,create=file
lxc.mount.entry: /dev/nvidia-modeset dev/nvidia-modeset none bind,optional,create=file
lxc.mount.entry: /dev/nvidia-uvm-tools dev/nvidia-uvm-tools none bind,optional,create=file
lxc.mount.entry: /dev/dri dev/dri none bind,optional,create=dir</code></pre><p>其中 <code>195</code>，<code>236</code>和<code>226</code> 数字是上面记录的，注意按实际更换填写</p><p>修改好保存，开机<br>登陆LXC 输入命令 <code>nvidia-smi</code><br>返回<br><img src="https://assets.insilen.com/pic/2024/01/0119174814.png" alt="" title="" style=""></p><h2>应用实例</h2><h3>LXC GPU容器中安装Emby</h3><p>LXC GPU直通的特性，LXC容器只能为 非特权容器直通<br>如果是特权容器启动 运行 <code>nvidia-smi</code>会返回</p><pre><code class="lang-shell">Failed to initialize NVML: Unknown Error</code></pre><p>这个特性问题无解，官方无解、Hack无解；<br>同时，又因为<strong>非特权容器</strong> 的特性，无法从容器中使用 <strong>SMB/CIFS</strong>  <strong>NFS</strong> 协议来链接外部存储。<br><img src="https://assets.insilen.com/pic/2024/01/0119175013.png" alt="" title="" style=""></p><p>使用以上架构的各位极客，多半存储位于外部NAS中的分布式；所以这里还需解决媒体目录挂载到LXC容器中问题，值得庆幸的是PromoxVE(PVE) 在WebUI中给予了大家一个非常有用的目录挂载功能，下面就来一一部署。</p><h4>下载emby安装文件</h4><p><span class="external-link"><a class="no-external-link" href="https://emby.media/linux-server.html" target="_blank"><i data-feather="external-link"></i>官方下载地址</a></span></p><h4>安装emby server</h4><p>例 下载的文件为<code>emby-server-deb_4.6.4.0_amd64.deb</code><br>先授执行权限</p><pre><code class="lang-shell">chmod +x emby-server-deb_4.6.4.0_amd64.deb</code></pre><p>然后执行安装</p><pre><code class="lang-shell">dpkg -i emby-server-deb_4.6.4.0_amd64.deb</code></pre><h4>设置emby</h4><p>打开浏览器   <code>http://localhost:8096</code> 执行设置；<br>设置过程略过，注意其中设置媒体库的时候跳过 不设置。</p><h4>设置转码</h4><p>安装初始设置后，进入管理后台：转码 - 启用硬件加速 -开启<br><img src="https://assets.insilen.com/pic/2024/01/0119175126.png" alt="" title="" style=""></p><p>此步骤 主要是校验LXC容器中的GPU</p><h4>解决NAS挂载</h4><p>这步最为重要，按照目前的 LXC/LXD 容器技术来看，要在非特权容器中直接解决这个问题是没有办法的，各位极客如果时间宝贵就不要尝试了，当然折腾精神永不灭，如果你在非特权容器中找到直接挂载<code>SMB/CIFS</code>的方法 请务必分享一下。</p><blockquote>这里分享一下折腾案例，非特权容器中使用 <code>smbclient</code> 是可以访问到 NAS 的，这里会造成错觉。这并不意味着<code>mount -t cifs</code> or <code>mount.cifs</code> 能正确挂载</blockquote><p>所以就是如此的无奈，非特权才能"vGPU"。 特权才能<code>SMB/CIFS</code></p><p>好在还有一个办法能非常巧妙的平衡这个不足，思路为：</p><p><strong>Proxmox VE(PVE)宿主机挂载NAS目录</strong> - <strong>LXC 非特权容器挂载宿主机中目录</strong></p><p>说到这里可能意识了到了<strong>LXC 非特权容器挂载宿主机中目录</strong> 为<br>上一步<strong>Proxmox VE(PVE)宿主机挂载NAS的目录</strong></p><p>接下来实践：<br>打开 WebUI 定位到 <strong>数据中心-存储-添加-SMB/CIFS</strong></p><p><img src="https://assets.insilen.com/pic/2024/01/0119175155.png" alt="" title="" style=""></p><p>添加一个存储<br><img src="https://assets.insilen.com/pic/2024/01/0119175218.png" alt="" title="" style=""></p><table><thead><tr><th>选项</th><th align="left">值</th><th align="left">解释</th></tr></thead><tbody><tr><td>ID</td><td align="left">video-nas</td><td align="left">SMB/CIFS的ID 这个名称会作为宿主机内文件夹名称</td></tr><tr><td>服务器</td><td align="left">10.10.200.50</td><td align="left">NAS的内网IP地址</td></tr><tr><td>用户名</td><td align="left">movide</td><td align="left">NAS共享目录的用户</td></tr><tr><td>密码</td><td align="left"><strong><em><em></em></strong><strong></em></strong></td><td align="left">NAS共享目录的密码</td></tr></tbody></table><p>填写完上面的信息之后 <strong>Share</strong> 选项才能被激活，打开<strong>Share</strong>选项里面就是NAS的目录</p><p><img src="https://assets.insilen.com/pic/2024/01/0119175335.png" alt="" title="" style=""></p><p>除了 服务器、用户名、密码、Share  4个选项 其余配置可以参考我的设置，其中<strong>启用</strong> 是关闭的，这个操作主要为了不让这个目录显示在ProxmoxVE WebGUI中，就不显的那么凌乱了</p><p>确定配置无误即可 添加</p><p>添加之后可以通过 路径/目标 获得NAS目录在宿主机中挂载位置，并记录下它<br>例如我的是<code> /mnt/pve/video-nas</code><br><img src="https://assets.insilen.com/pic/2024/01/0119175357.png" alt="" title="" style=""></p><p>最后关闭正在运行的LXC，然后只需要用下面的命令挂载这个目录到GPU LXC中：</p><pre><code>pct set 100 -mp0 /mnt/pve/video-nas,mp=/video</code></pre><p>命令解释：挂载宿主机目录<code>/mnt/pve/video-nas</code>到 ID为100 LXC容器中的<code>/video</code>目录下</p><h4>目录权限</h4><p><strong>问题一：</strong><br>可能会遇到 LXC 容器中 <code>/video</code>目录只能读取不能写入的问题，需要从一下几点进行尝试：</p><h5>1. NAS 账号权限</h5><p>NAS账号是否已经对共享目录给予了读写权限</p><h5>2. 宿主机目录权限</h5><p>可以尝试 使用命令来修复权限</p><pre><code class="lang-shell"> chmod 755 /mnt/pve/video-nas</code></pre><h5>4. LXC目录权限</h5><pre><code class="lang-shell"> chmod 755 /video</code></pre><p><strong>问题二：</strong><br>emby server对挂载来的目录没有写入权限</p><h5>4. LXC 目录权限</h5><pre><code class="lang-shell"> chown -R emby:emby  /video</code></pre><h3>LXC GPU容器中安装Plex</h3><p>方法请类推，基本一致</p><h3>LXC GPU容器中安装Jellyfin</h3><p>方法请类推，基本一致</p><p>参考资料：</p><p><span class="external-link"><a class="no-external-link" href="https://passbe.com/2020/02/19/gpu-nvidia-passthrough-on-proxmox-lxc-container/" target="_blank"><i data-feather="external-link"></i>GPU (Nvidia) passthrough on Proxmox LXC container</a></span></p><p><span class="external-link"><a class="no-external-link" href="https://theorangeone.net/posts/lxc-nvidia-gpu-passthrough/" target="_blank"><i data-feather="external-link"></i>Nvidia GPU passthrough in LXC</a></span></p><p><span class="external-link"><a class="no-external-link" href="https://www.bilibili.com/read/cv13181675" target="_blank"><i data-feather="external-link"></i>【亿点笔记】Proxmox VE(PVE) 下直通GPU给LXC 进行CUDA coding</a></span></p>

部署步骤

宿主机操作部分

安装header

环境准备

安装显卡驱动

添加模块

屏蔽不兼容驱动

更新模块

创建规则

重启

检查

LXC操作部分

下载驱动程序

修改LXC配置文件

应用实例

LXC GPU容器中安装Emby

下载emby安装文件

安装emby server

设置emby

设置转码

解决NAS挂载

目录权限

1. NAS 账号权限

2. 宿主机目录权限

4. LXC目录权限

4. LXC 目录权限

LXC GPU容器中安装Plex

LXC GPU容器中安装Jellyfin

发表评论 取消回复 使用Cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

Proxmox VE(PVE) 下直通GPU给LXC

发表评论取消回复
使用Cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款