CDU泵技术发展如何满足75~200kW数据中心机架需求

概述

随着机架功率密度现在已经攀升到75~120kW及以上,传统风冷散热正在达到其物理和经济极限,因此数据中心的风冷时代正在快速结束。直接芯片冷却(D2C)的液体制冷已成为未来唯一可行的技术路线,这种技术能够在热量产生的源头高效、可预测地进行散热。

但是,随着制冷分配单元(CDU)不断发展以服务于这种新型高密度机架,需要重新关注一个重要的子系统:泵。就CDU而言,是选取离心泵,还是容积泵(positive displacement pump)不仅关系到设计细节,也决定了散热效率、系统对负载变化的响应灵活性、以及对系统进行扩展成本方面的要求。

本文将探讨为什么离心泵是75~120kW及以上现代液冷CDU的最佳解决方案,并分析了影响性能、可靠性和总体成本的关键设计因素。 

CTO和热管理工程师需关注的要点

  • 液体制冷目前已经势在必行,而不再是一种奢侈品。对于超过40kW的机架密度,仅仅通过空气已经不能可靠地制冷。而且随着功率密度进一步增大,液体制冷变得越来越重要。传统的空气制冷仅能够支持每机架20~40kW,当代先进的RDHx技术(使用冷水的背板热交换器)可将其扩展到50~80kW。若功率密度再进一步提高,需要直接液体制冷才能可靠运行。离心泵能够实现可变计算负载的自适应流量控制,减少能源浪费,并确保系统的热稳定性。
  • 系统级优化非常重要。泵、热交换器和传感器必须作为一个集成式系统进行综合设计,避免出现气穴、振动和效率损失。
  • 50~120 kW的CDU代表了系统设计的“最佳点”,离心泵在这个功率范围内非常合适,能够在紧凑性、可扩展性和成本效益之间达到最佳平衡。
  • 公司内部工程能力(设计、原型制作、验证)有助于精确控制泵的运行曲线、材料和性能,以满足数据中心的可靠性要求
  • ASHRAE W级定义了IT设备采用供给制冷水(或制冷剂)的标准温度范围,它们可作为数据中心设计师和操作员设置允许供给液体温度的指导,供给液体通过降低ΔT、增加流体粘度和更小NPSH裕度可直接影响泵的性能,这些都是选择可靠CDU泵设计的关键因素。通过规定每种等级(如W32或W40)的最低和最高允许进水温度,这些指南可直接影响泵的尺寸、材料选择、流速和控制策略。进而能够确保即便在峰值负载下,制冷剂也能在所需的温度和压力下可靠地输送。

 

液体制冷的效率优势


过去几十年以来,风冷一直在为数据中心提供良好的服务,但目前这种技术正接近其散热上限。传统的室内风冷一般功率不超过每机架15~20kW;采用背板热交换器可将其增加到约50~80kW,但75~120kW及以上的AI/HPC机架通常需要直接到芯片液体制冷。

根据具体的比热、密度和温度,在20℃温度下,液体制冷的热容量比空气高3500倍以上 (ASHRAE TC 9.92024),可显著提高热效率,并实现更密集的计算,而不会受到过多气流的影响。通过将散热点更靠近芯片,D2C系统能够最大限度地降低温度梯度,即便机架功率上升,也能保持一致的入口温度。

 

data centers cooling types


50~120kW CDU “最佳点”

在此功率密度范围内,泵的工作状态定义了系统平衡状态。压力过大会导致功率浪费和潜在的密封磨损,流量过小则有出现热点和气穴的风险。

无论是紧凑型50 kW AI训练机架制冷,还是120 kW HPC设备,正确选择离心泵都能确保在所有负载瞬态下稳定、高效地运行。通过保持可预测的压力和流量特性,离心式CDU可提供一致的制冷液温度,并可延长服务器寿命。
 

应用介绍:
- 机架密度:50~120 kW(AI/HPC典型值≥75 kW)
- 流量范围:38~303 L/min(10~80 G/min),取决于工作条件、ΔT、压力和制冷剂特性
- 工作介质:水/乙二醇(典型值75/25)
- 设计重点:低净正吸入压头(NPSH)、高MTBF、最小占位面积
- 泵类型:离心泵
- 主要优点:高流量效率、可靠性、适应性


高功率密度机架的兴起

  • Early 2000s: 2-5 kW per rack
  • 2010-2020: 10-20 kW per rack for enterprise compute
  • 2025: 100 kW AI clusters, HPC, and edge deployments regularly exceed 100 kW per rack
  • 2030: Projected to be >250 kW per rack

高功率密度机架的发展毋庸置疑,单位机架的制冷需求正在呈指数级增长。
•    21世纪初:每个机架2~5kW
•    2010~2020年:用于企业计算的每个机架10~20kW
•    2025年:100 kW 人工智能集群、高性能计算、以及边缘部署通常每机架超过100 kW
•    2030年:预计每机架功率>250 kW

热密度的指数级增长已经超出了风冷技术的改进。为了维持系统性能,热管理工程师现在必须优化液体制冷回路中的每个子系统,包括能够主导整个系统流量和稳定性的CDU泵。

在这些功率密度下,CDU性能直接影响服务器的正常运行时间、用电效率(PUE)和总系统效率。选择合适的泵对于实现系统性能和可靠性目标至关重要。

 

离心泵与容积泵

为何离心泵在CDU应用中胜出


齿轮型或隔膜型等容积泵能够保持固定体积量输出,非常适合高压、低流量应用。然而,在系统压力相对较低,但流量调节至关重要的数据中心液体制冷环境中,容积泵的恒定流量特性则成为应对可变负载的一个缺点。

相比之下,离心泵能够将叶轮的旋转能转化为流体速度,自然地适应系统负荷。这会导致下列优势:


•    大容量液体平稳流动,能够输送大量制冷剂,确保许多直接制冷芯片的均匀温度控制
•    在典型的D2C制冷系统中,离心泵在处理低粘度流体时具有高能量效率,从而降低了能耗和运营成本
•    典型40~120kW CDU应用中,流量范围为38~303L/min(10~80G/min),离心泵效率极高
•    由于运动部件少,因而磨损少,振动低,运行更安静,维护成本低,可靠性更高
•    系统具有较低建造成本、较低前期成本、以及较低维护费用,从而降低了总体拥有成本

Centrifugal Water Pump
 离心式水泵 
Positive Displacement Gear Type Pump
齿轮式容积泵 

 

 

离心泵能够为液冷数据中心应用提供极佳的性价比,特别是针对紧凑性和可变热负荷非常关键的应用。

离心泵内部设计

inside centrifugal pump离心泵的核心部件是叶轮和蜗壳组件,它们能够使液体加速从旋转中心径向向外流动。当速度能量在蜗壳内转化为静压时,压力就会增大,从而产生连续可控的流动。

 

这种固有的平滑、无脉冲液体流动能够通过变频器(VFD)和传感器反馈进行微调控制。随着CDU系统变得更加智能,集成了温度、流量和压力传感器,离心泵的可调节流量特性也变得更有优势。

设计见解:
叶轮几何形状直接定义了扬程(head)和流量特性。塔克热系统(Tark Thermal Solutions)的内部设计和原型制作确保每台泵都符合50120kW机架应用的目标性能曲线。

 

下图中的泵性能曲线突显了在最坏的温度/高度下,预期38303L/min1080G/min)工作范围内的最佳效率点(BEP),要求NPSH裕度≥1020%

centrifugal pump flow rate
Flow Rate (L/min)

 

密封策略:提供无密封磁力驱动选项,以最大限度降低泄漏风险;否则,可指定与乙二醇混合物和添加剂兼容的机械密封类型/材料。
材料:接触液体的部件(SS316L、工程聚合物)、陶瓷轴承、与乙二醇兼容的腐蚀抑制剂。
洁净度和过滤:入口50~100µm Y型过滤器;侧流过滤;空气分离器/脱气器,以避免气穴和微气泡。
冗余:N+1台泵,具有自动故障切换功能;隔离阀和快速断开装置,便于维修使用。
控制:VFD关联到ΔT和压差设定值;低NPSHa/进气报警;CDU入口/出口和歧管分支处的流量、压力、温度传感器。
振动/声学:确定机架部署相邻设备的可接受振动(根据ISO 10816/20816等级)和噪声目标。
合规性:注意ASHRAE W级设计点(如W32/W40/W45)和设施接口(供水/回水温度、压力、水化学特性)。
 

工程和可靠性考虑因素

塔克热系统的公司内部泵工程项目将设计、原型制作和验证优化结合在一起,确保每个离心泵组件都符合严格的数据中心可靠性标准。

关键工程优先考虑事项包括:
•    防气穴:优化的入口几何形状和材料选择可防止在低压区形成蒸汽。
•    材料兼容性:不锈钢、工程聚合物和陶瓷轴承可确保在混合流体环境(水/乙二醇)中的长寿命。
•    紧凑的外形尺寸:易于集成的外形尺寸更适合现代CDU机柜,而不会牺牲液体流动空间。
•    耐热性:泵的专门设计确保在升高的制冷剂温度下全天候运行,可在数百万次循环中保持高性能。
•    可扩展输出:可配置设计支持10~60 GPM的流量,涵盖D2C CDU中常见的50~120 kW热管理范围。


塔克热系统泵模块完全有资质在体现Tier 3+数据中心环境的负载、压力和温度循环下连续运行。

结论:重新思考面向液冷未来的泵性能


数据中心行业的发展速度正在超出传统散热架构的适应能力。随着机架密度激增至75~120kW甚至更高,仅靠风冷无法满足散热要求,向D2C液体制冷的过渡不可避免,随之而来的是对CDU的更高性能要求。

与低粘度回路中用的尺寸过大产品或容积泵等竞争技术相比,尺寸合适的离心泵能够使工作时长的60~80%在BEP附近运行,NPSH裕度≥10-20%,能够有效地降低能耗,减少密封/轴承磨损,提高MTBF。

通过重新思考处在CDU核心的泵,工程师可针对下一代数据中心应用环境解锁更高的效率、更高的可靠性和可增加的制冷能力。

塔克热系统的离心泵技术是公司内部开发和测试,专为应对这些挑战而设计,兼具经过验证的液压性能(hydraulic performance)以及现代数据中心所需的紧凑性和高效率。

了解关于塔克热系统用于数据中心CDU制冷泵的更多信息 

data center liquid cooling solutions

Applications

Data Centers Industrial

Product Section

Pumps