戴尔R7920工作站利用PVE开启vGPU,实现工作站虚拟化(ShareStation)
介绍
本文介绍了使用Proxmox VE(PVE) + DoraCloud,将一台Dell R7920图形工作站(配置有NVIDIA RTX A6000显卡)实现工作站虚拟化。可以满足多个设计用户同时使用3D应用的需求。
方案适合于设计工作室、工厂设计部门、设计院等单位。
工作站虚拟化(ShareStation)与直接使用工作站相比,有如下几个方面的优势:
【资源共享】
GPU资源可以灵活调配,资源共享。
比如A6000卡,切分成显存6G的6Q配置,可以分配给8个用户用。人均8G显存。每个用户最大可以利用到A6000的全部算力。
【远程设计】
工作站虚拟化采用云桌面方案,实现了GPU的虚拟化。用户通过云终端远程接入工作站。拜托了设计师的时间、地点的限制。能够充分发挥设计师的创意和灵感。
【信息安全】
工作站虚拟化,将设计资料全部保存在数据中心的工作站/服务器上。用户云终端上不留存资料。可以防止资料意外丢失,或者泄密。
企业的设计部采用工作站虚拟化方案,可以非常便捷的与客户或者供应商沟通设计方案,而不用当心设计图纸的泄密。
准备条件
1、一台Dell R7920 机架式工作站,配置 Xeon Gold 6226R,256G, 1TB SSD, RTX A6000卡。
2、一个启动U盘。
3、网络内有DHCP服务。
安装步骤
1、设置BIOS,开启SR-IOV
Processor Settings中,
【Virtualization Technology】 设置为 Enable
Integrate Devices中,
【SR-IOV Global Enable】 设置为 Enable
【Memory Mapped I/O above 4G】 设置为 Enable
【Memory Mapped I/O base】 设置为 56TB
另外,启用主板的集成显卡输出。A6000 需要设置成不输出的vGPU模式。如果把工作站的输出配置为A6000,那么对A6000进行配置后,工作站会无法输出。因此必须设置集成显卡输出
2、安装Proxmox VE 7.3
使用Ventoy制作启动U盘。
Ventoy作为新一代U盘启动工具,不需要反复对U盘进行格式化。只需要把ISO拷贝到Ventoy制作好的U盘上即可。简化了启动U盘的制作。并且可以实现一个U盘实现多个系统的启动。
把 Proxmox的ISO文件拷贝Ventory制作的U盘根目录即可。
安装 Proxmox VE 7.3
工作站开机,按F12,选择U盘启动,进入Ventoy启动菜单。选择Proxmox VE 7.3的ISO镜像启动。进入Proxmox的安装过程。
3、配置A6000为vGPU模式
Proxmox的Shell中,运行 displaymodeselector ,设置为不输出的模式。
root@test:~# ./displaymodeselector --gpumode
NVIDIA Display Mode Selector Utility (Version 1.48.0)
Copyright (C) 2015-2020, NVIDIA Corporation. All Rights Reserved.
WARNING: This operation updates the firmware on the board and could make
the device unusable if your host system lacks the necessary support.
Are you sure you want to continue?
Press 'y' to confirm (any other key to abort):
y
Select a number:
<0> physical_display_enabled_256MB_bar1
<1> physical_display_disabled
<2> physical_display_enabled_8GB_bar1
Select a number (ESC to quit):
1
Specifed GPU Mode "physical_display_disabled"
Update GPU Mode of all adapters to "physical_display_disabled"?
Press 'y' to confirm or 'n' to choose adapters or any other key to abort:
y
Updating GPU Mode of all eligible adapters to "physical_display_disabled"
Apply GPU Mode <4> corresponds to "physical_display_disabled"
Adapter: Graphics Device (10DE,2230,1028,1459) S:00,B:AF,D:00,F:00
EEPROM ID (EF,6015) : WBond W25Q16FW/JW 1.65-1.95V 16384Kx1S, page
EEPROM ID (EF,6015) : WBond W25Q16FW/JW 1.65-1.95V 16384Kx1S, page
操作完毕后,检查A6000的图形模式
root@test:~# ./displaymodeselector --listgpumodes
NVIDIA Display Mode Selector Utility (Version 1.48.0)
Copyright (C) 2015-2020, NVIDIA Corporation. All Rights Reserved.
Adapter: Graphics Device (10DE,2230,1028,1459) S:00,B:AF,D:00,F:00
EEPROM ID (EF,6015) : WBond W25Q16FW/JW 1.65-1.95V 16384Kx1S, page
GPU Mode: Graphics mode with physical display disabled
4、配置A6000开启SR-IOV
A6000显卡支持SR-IOV方式的vGPU,需要先启用显卡的 SR-IOV 支持。
直接执行
/usr/lib/nvidia/sriov-manage -e 0000:af:00.0
为了实现服务器重启后,还能生效,添加一个sriov的服务。
cat >/etc/systemd/system/sriov.service <<EOF
[Unit]
Description=Script to enable SR-IOV on boot
[Service]
Type=simple
#start SR-IOV
ExecStart=/usr/lib/nvidia/sriov-manage -e 0000:af:00.0
Restart=on-failure
[Install]
WantedBy=multi-user.target
EOF
systemctl daemon-reload
systemctl enable sriov.service
systemctl start sriov.service
5、执行安装DoraCloud的vGPU脚本
Proxmox上执行如下三个脚本,可以完成Proxmox的设置以及NVIDIA vGPU的驱动安装
1)修改Proxmox的安装源,并执行更新。安装 pve-headers、dkms等包。
curl -o- http://www1.deskpool.com:9000/software/gpu01.sh |bash
2)启动IO-MMU
curl -o- http://www1.deskpool.com:9000/software/gpu02.sh |bash
执行脚本后,会自动重启服务器。
3)安装nvidia vGPU显卡驱动。
curl -o- http://www1.deskpool.com:9000/software/gpu03.sh |bash
执行脚本后,会自动重启服务器。
4)最后执行 DoraCloud安装脚本
cd /var/lib/vz/dump; wget -qO- https://dl.doracloud.cn/dpinstall.pl --referer https://doracloud.cn | perl
6、完成DoraCloud桌面的配置,开启vGPU
DoraCloud的配置,就不再详细介绍了。参见前面的博客
https://www.cnblogs.com/doracloud/p/16299534.html
7、使用DoraClient客户端测试
下载DoraClient,配置服务器地址为 DoraCloud地址,输入账号,密码,即可连接桌面。
8、发布到公网,实现远程设计
具体参见 DoraCloud 网关的配置。
https://docs.doracloud.cn/tasks/gateway/
戴尔R7920工作站利用PVE开启vGPU,实现工作站虚拟化(ShareStation)的更多相关文章
- 戴尔dell服务器硬件故障SMTP邮件报警idrac配置
上次公司有台戴尔的服务器硬盘故障了却没有及时发现,后面就研究了一下看到戴尔的idrac有硬件SMTP报警功能 然后自己折腾了一下,一开始配置不成功,后面问了一下戴尔官方的最好自己再摸索了一下解决了,做 ...
- 戴尔服务器使用omreport(OMSA)查看监控硬件信息
安装OMSA wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash yum install -y n ...
- 戴尔PowerEdge服务器RAID控制卡的配置
示例演示环境:PowerEdge R620 + H710p Raid控制卡 + 9 x 300G 10k SAS 硬盘 H310.H710.H810的配置方法与H710P大致相同,在此不再累述. 特 ...
- 戴尔iDRAC服务器远程控制设置
对于远程的服务器,我们不能经常性的去机房维护,所以远程控制对于服务器来说就显得至关重要.那么你是用什么方式对服务器进行远程控制呢?远程桌面?还是KVM切换器?NO,你OUT了!如果你用的是戴尔的服务器 ...
- 戴尔灵越14燃5488安装LTSC2019
戴尔笔记本应该改成ahci模式之后再进行分区和重装系统操作,否则很难折腾的 戴尔灵越14燃5488不能安装LTSB2016,因为显卡驱动不支持,安装LTSC2019可以,亲测. 这款笔本似乎NVME ...
- Proxmox 5.4使用vgpu_unlock,为GTX1060开启vGPU支持
本文介绍如何为GTX1060显卡开启vGPU功能.消费级显卡不支持nvidia GRID vGPU功能.在2021年初,疫情激发了黑客的创作热情,给出了一个vgpu_unlock的补丁,可以让消费级显 ...
- 戴尔灵越15-5000/3558等系列修改BIOS设置U盘启动
今天在电脑群遇到一个群友的机型是戴尔灵越15-5000,他问我这款机器怎么设置U盘启动. 看到它的BIOS界面之后,我来了点兴趣.. 本文供图:辽宁沈阳-打老虎(921407164) 电脑群:电脑爱好 ...
- 戴尔OMSA 使用指南
戴尔的OMSA我们已经安装完成,但是没有web页面.因此我们目前想要看到服务器的相关硬件信息就需要使用命令行的方式获取了.那么,这里就介绍如何使用命令获取服务器硬件信息. 下面是我监控一些硬件信息的命 ...
- 戴尔PowerEdge服务器命名规则和型号分类
从第十代服务器开始,戴尔重新规范了服务器的名字,以现在的第十二代主流PowerEdge R620服务器为例: 第一位是字母,R代表机架式服务器,其它有: R:Rack,机架式服务器 T:Tower,塔 ...
- 戴尔笔记本win8.1+UEFI下安装Ubuntu14.04过程记录
瞎扯:笔记本刚买不久就想装ubuntu来着,但结果发现BIOS启动方式为UEFI,网上一搜索发现跟曾经的双系统安装方法不一样,看详细教程感觉相当复杂,并且也有点操心折腾跪了这新本本所以一直没有动手.但 ...
随机推荐
- 2D 可视赋能智慧水务绿色集约化发展
前言 随着国家对环境保护治理程度的日益重视,各地政府积极响应国家政策,在共同聚焦生态文明建设下,急速催生了水务行业数字化转型.如今 "供排污"一体化管理系统成为行业发展的重要趋势, ...
- 深度 | 新兴软件研发范式崛起,云计算全面走向 Serverless 化
11月3日,2022 杭州 · 云栖大会上,阿里云智能总裁张建锋表示,以云为核心的新型计算体系正在形成,软件研发范式正在发生新的变革,Serverless 是其中最重要的趋势之一,阿里云将坚定推进核心 ...
- <vue 组件 4、插槽的使用>
代码结构 一. 01-slot-插槽的基本使用 1. 效果 同样的一个插槽,父组件调用的时候不同展现的内容就不同 2.代码 01-slot-插槽的基本使用.html <!DOCTYPE ...
- vue3组件el-dialog提取
父组件: 1 <template> 2 <div class="auto-wrap"> 3 <div class="content-left ...
- 机器学习-决策树系列-GBDT算法-集成学习-30
目录 1. 复习 2. GBDT 3. gbdt应用于二分类: 3. gbdt应用于多类 4. 叶子节点输出值c的计算 5. GBDT的其他应用 6. GBDT+LR 代码实现 1. 复习 再开始学习 ...
- Hystrix 实现服务熔断与降级
本文为博主原创,未经允许不得转载: 目录: 1. 服务雪崩,服务熔断,服务降级概念 2. Hystrix 概念 3. Hystrix 使用及默认配置 4. @HystrixCommond 注解使用 5 ...
- spring,springBoot配置类型转化器Converter以及FastJsonHttpMessageConverter,StringHttpMessageConverter 使用
转载请注明出处: https://i.cnblogs.com/posts/edit;postId=14045507 spring,spring boot 等框架项目通过@RequestBody,@Re ...
- Metastability 亚稳态问题
亚稳态问题 各种跨时钟域的问题都会归结于亚稳态的问题,IP设计时钟域不超过两个,对于CDC设计要求不高;对于SoC设计来说,CDC处理十分重要 1.什么是亚稳态? transition time 是可 ...
- 【PID】初学者的pid,详细的介绍了代码为什么是这样写的
from:Improving the Beginner's PID – Introduction « Project Blog (brettbeauregard.com)
- [转帖]Nacos使用2.0.1版本启动出现9848端口错误的解决方式(亲测有效)
目录 一.背景 二.报错如下 三.报错原因 四.解决方式 一.背景 nacos服务端和客户端都是 2.x版本. centos7使用原始安装nacos单机版,没有使用docker安装naocs集群. 二 ...