前篇文章中『服务器散热效能不佳有解吗?专家建议这么做』提到气冷式的服务器其散热效能对于系统稳定度是非常重要的关键因素,同时也说明了百佳泰对于散热效能能提供的协助与服务。

本篇将为您延伸说明百佳泰如何进行评估,同时也会举例在测试过程中发现的问题及改善后的数据。

AI服务器的散热架构三大重点:

  1. GPU导风罩:尝试不同的GPU导风罩架构,用以集中服务器进风量,加强对GPU的降温效果。
  2. GPU托盘:改动GPU托盘架构,验证出风面积大小对GPU散热的影想程度。
  3. CPU导风罩:尝试封闭CPU导风罩间隙,集中风流,验证CPU降温效果。

百佳泰专业技术团队会先与您讨论现况,并实际确认散热架构后,将开始进行温度监控的热电偶布点,完成布点后,开始执行加压程序及温度数据的收集。加压过程中会有不同部件的加压(ex. GPU or CUP)及加压的程度 (ex. 30%~100%),同时也会尝试对风扇的转速控制或制造风扇的故障来模拟各种情境以收集相关的数据做分析,以确保服务器在遇到突发状况时仍能够保持散热的稳定性。

百佳泰针对此项目尝试了两个散热架构的数据收集,经过分析后确认散热架构1的表现较符合预期,测试结果如下图:

在数据收集的过程中,我们也发现了一个异常的现象,在收集PSU布点的电热偶数据中发现:温度的曲线并非是越靠近中心温度越高,有两个点呈现相反的状态。经过分析、与客户讨论后找出其实际原因是因为热风回流所导致,而发生的地方就是在PSU附近的机壳侧面或缝隙。数据数据及过程如下:

改善前PSU温度异常 : 靠近核心的Temperature_2温度竟低于外侧温度

Temperature→ 可能的原因为机构设计导致积热/热回流等散热问题

改善后系统PSU温度正常 : PSU核心Temperature_3温度 > 靠近核心的Temperature_2温度 > 外侧温度Temperature_1

百佳泰对于服务器散热架构的评估服务有丰富的经验及相关的能力,能够协助客户尽速完成各种架构的评估及最终方案的选定。同时,百佳泰亦建置下列各种不同热负载的Walk-in Chamber,能满足各类型的服务器进行散热架构评估。

13KW Walk-in Chamber

  • Temperature Range: -20 ℃ ~ 80 ℃

20KW Walk-in Chamber

  • Temperature Range: -40 ℃ ~ 150 ℃

65KW Walk-in Chamber

  • Temperature Range: -40 ℃ ~ 90 ℃

 

一站式客制化顾问咨询,有效改善服务器散热效能

若您对于服务器散热相关的顾问服务有进一步需求,欢迎填写窗口与我们联系,百佳泰服务团队将诚挚为您服务!

更深入、更有效的解决方案,敬请期待下集文章!

联系窗口

Contact Us