解决 Dell PowerEdge T630 增加第三方 PCIe 设备后制冷系统异常
博客链接:解决 Dell PowerEdge T630 增加第三方 PCIe 设备后制冷系统异常
配置
- Device: Dell PowerEdge T630
- CPU: Intel(R) Xeon(R) E5-2696 v4 x2
- GPU 1: Matrox Electronics Systems Ltd. G200eR2
- GPU 2: NVIDIA GeForce GTX 1060 3GB
- OS: Proxmox VE bookworm 8.3.1 x86_64
- iDRAC firmware: 2.86.86.86
- BIOS: 2.19.0
- PSU: 750W x1
注意
本文中提到的方案无论根据社区经验还是官方文档都不适用于本文使用的软件及硬件配置,但不知道因为什么原因它实际生效,故本文方案仅提供参考价值
无论使用哪种方案,请确保第三方 PCIe 设备能够获得足够的冷却,本文中使用 GTX 1060 显卡在禁用 默认冷却响应 后运行实际业务 1 小时后测得温度稳定在 48℃,若实际运行温度过高请尝试提高风扇转速或启用 默认冷却响应 来保证设备运行安全,或寻求调速以外的其他物理方案
为什么需要调速
Dell 服务器在添加了第三方 PCIe 设备后,会启用 默认冷却响应逻辑,以根据常见行业卡规范来提供气流。该策略目标为向 PCIe 区域提供最多 55℃ 的进气
基于 T630 风道设计,风扇组中 6 个风扇有 4 个用于 CPU 风道,只有剩余的 2 个风扇的部分风道用于 PCIe 区域散热,这就造成添加任何需要额外冷却的 PCIe 设备都会导致服务器风扇组处于 90% 以上的转速且不可控,这个声音非常吵且无任何必要性
本文中使用的配置不需要 PCIe 区域获得额外气流,并且由于新版本 iDRAC 中取消了手动配置风扇组转速的能力,所以需要借助 ipmitool 来手动控制冷却策略
手动控制
在社区方案中,提到了使用 ipmitool 写入指令的方式来手动调整风扇转速,该工具用于 IPMI 通信
在主机中安装 ipmitool
apt install ipmitool openipmi openipmi-tools
本文使用 -I open 选项,使用 OpenIPMI 驱动接口通过内核直接与 IPMI 交互
# 配置为手动控制
ipmitool -I open raw 0x30 0x30 0x01 0x00
# 调速固定为 30%
ipmitool -I open raw 0x30 0x30 0x02 0xff 0x1e
0x30 0x30 0x01 为手动模式/自动模式切换,手动模式值为 0x00,自动模式 0x01
0x30 0x30 0x02 为转速控制,其值控制脚本如下
# Usage: ./fan_speed.sh 30
if [ "$1" != "" ]; then
fan=`printf "0x%x" $1`
else
fan=0x1e # 30%
fi
ipmitool -I open raw 0x30 0x30 0x02 0xff $fan
该方案根据社区反馈,在重启后需要重新配置
理论上新版本的 iDRAC 已经关闭了 IPMI 中制冷系统的手动模式控制接口,只有在非常老旧的版本中才允许使用手动控制,由于 iDRAC 降级必须保证连续版本降级,即 2.86.86.86 => 2.85.85.85 => 2.84.84.84 => ...,实际操作降级可能会非常困难
在实际测试中,该方案仅调整了系统制冷系统中包含的风扇组,并不能控制 PSU 风扇转速
禁用第三方 PCIe 卡默认冷却响应
PowerEdge:如何在 PowerEdge 13G 服务器上禁用第三方 PCIe 卡默认冷却响应
Dell 官方知识库中,这篇文章提到了冷却策略的调整方式,虽然文档开头就注明了 本文不适用于 PowerEdge T630,但实际测试有效
# Enable
ipmitool -I open raw 0x30 0xce 0x00 0x16 0x05 0x00 0x00 0x00 0x05 0x00 0x00 0x00 0x00
# Disable
ipmitool -I open raw 0x30 0xce 0x00 0x16 0x05 0x00 0x00 0x00 0x05 0x00 0x01 0x00 0x00
0x30 0xce 0x00 0x16 0x05 0x00 0x00 0x00 用于控制冷却响应逻辑模式
0x30 0xce 0x01 0x16 0x05 0x00 0x00 0x00 用于获取冷却响应逻辑模式状态
0x05 0x00 0x00 0x00 0x00 启用 默认冷却响应逻辑
0x05 0x00 0x01 0x00 0x00 禁用 默认冷却响应逻辑
通过禁用 默认冷却响应逻辑 的方式来降低整机所有组件的制冷策略
理论上该方案仅适用于 Dell PowerEdge R 系列服务器
解决 Dell PowerEdge T630 增加第三方 PCIe 设备后制冷系统异常的更多相关文章
- Dell poweredge r210进BIOS改动磁盘控制器(SATA Controller)接口模式
Dell poweredge r210进BIOS改动磁盘控制器(SATA Controller)接口模式 开机后按F2键进入BIOS设置,例如以下图: BIOS设置主界面: 使用上下键移动光标到&qu ...
- Dell PowerEdge R710服务器内存条插法/Dell 11G/12G系列服务器内存条插法(转)
说明:以我的经验,其实插3/6/9这个顺序去一定没有错. DELL PowerEdge R710服务器支持 DDR3的 DIMM (RDIMM) 或 ECC非缓冲的 DIMM(UDIMM).单列和双列 ...
- Dell PowerEdge R720内存安装原则
Dell PowerEdge R720内存安装原则 摘要:系 统包含 24 个内存插槽,分为两组(每组 12 个),每个处理器一组.每组的 12 个插槽分入四个通道.在每个通道中,第一个插槽的释放 ...
- dell PowerEdge R720 自动重启分析
dell PowerEdge R720 自动重启分析 摘要: 一,问题描述: 在同一批服务器当中,碰到这样一台服务器,如果不跑任何服务时没有问题,但一跑任务就是自动重启.既然同样的系统别的服务器都没出 ...
- android wear开发之:增加可穿戴设备功能到通知中 - Adding Wearable Features to Notifications
注:本文内容来自:https://developer.android.com/training/wearables/notifications/index.html 翻译水平有限,如有疏漏,欢迎批评指 ...
- PCIe设备的配置空间
关于PCI设备的配置空间网上已经有很多资料了,如下图就是PCI设备必须支持的64个字节的配置空间,范围为0x00-0x3f. 很多PCI设备仅仅支持者64字节的配置空间.PCI和PCIe配置空间的区别 ...
- nginx增加第三方模块
增加第三方模块 ============================================================ 一.概述nginx文件非常小但是性能非常的高效,这方面完胜ap ...
- DELL PowerEdge R410系统日志满报错
DELL PowerEdge R410系统日志满报错 重启服务器时在自检过程中看到CTRL+E时快速按下CTRL+E进入到远程管理ip地址配置界面
- Debian 为nginx增加第三方模块
为nginx增加第三方模块需要重新编译nginx的,但是debian在安装nginx的时候做了很多事情,比如systemd,/etc/nginx/里的各种文件,所以我们最好在debian源代码包的基础 ...
- Dell PowerEdge RAID Controller (PERC) | Dell
Dell PowerEdge RAID Controller (PERC) The Dell™ PERC (PowerEdge™ RAID Controller) fami ...
随机推荐
- Linux系统 tcpdump 抓包命令使用教程
tcpdump 是Linux系统下的一个强大的命令,可以将网络中传送的数据包完全截获下来提供分析.它支持针对网络层.协议.主机.网络或端口的过滤,并提供and.or.not等逻辑语句来帮助你去掉无用的 ...
- adduser和addgroup命令讲解
https://wiki.alpinelinux.org/wiki/Setting_up_a_new_user 在Alpine Linux下创建用户和组命令分别是adduser和addgroup,本文 ...
- 从 $PGDATA 到文件组:深入解析 PostgreSQL 与 SQL Server 的存储策略
从 $PGDATA 到文件组:深入解析 PostgreSQL 与 SQL Server 的存储策略 在数据库领域,数据存储和管理的效率与可靠性是决定系统性能.可扩展性和易于管理的关键因素.Postgr ...
- Qt音视频开发47-文字和图片水印(可存储到MP4中)
一.前言 近期花了两周时间闭门啃硬骨头,主要就解决三个问题(音视频同步存储和推流.图片水印并将水印信息存储到文件或者推流.rtsp推流),这三个问题困扰了很多年,以至于找遍了网络和翻遍ffplay代码 ...
- FFmpeg命令行示例
1 提取视频流/音频流 // 分离视频流和音频流 ffmpeg -i input_file -vcodec copy -an output_file_video ffmpeg -i input_fil ...
- VUE3基础环境搭建
VUE3基础环境搭建 1. 安装vue.js npm install vue -g 安装webpack Webpack 是一个现代 JavaScript 应用程序的静态模块打包器(module bun ...
- Jetbrains fleet 配置 C++开发环境(基于CMAKE和MinGW)
Jetbrains fleet 配置 C++开发环境 1. 安装 Jetbrains Fleet 到Fleet下载页面下载Toolbox并安装 Jetbrains-Fleet下载页 安装完成后在任务栏 ...
- 1273 - Unknown collation: 'utf8mb4_0900_ai_ci'
Navicat导出的MySQL8.0脚本在低版本MySQL导入执行报错 utf8mb4_0900_ai_ci 替换 utf8_general_ci utf8mb4 替换 utf8 完成以上两点替换再次 ...
- JAVA8 函数式编程(1)- Lambda表达式
1 简介 简洁的代码就能处理大型数据集合,让复杂的集合处理算法高效的运行在多核CPU上. 面向对象编程是对数据进行抽象,而函数式编程是对行为进行抽象,能编写出更易读的代码--这种代码更多地表达了业务逻 ...
- 最新AI智能体开发案例:小红书养生博主必备!教你用Coze工作流搭建「养生赛道」智能体!
嗨~我是老包.目前专注AI智能体开发与教学 ,持续分享Coze智能体.coze工作流搭建案例.** 老包用扣子为小红书养生赛道博主捏了一个神器 名字是: 「 小红书 | 爆款养生赛道图文生成器」 为什 ...