服务器液冷散热技术还有哪些不足?

随着云计算、大数据、人工智能(Artificial Intelligence,AI) 、自动驾驶等技术的快速发展,算力需求保持强劲的同时也出现明显的分化,不同的业务需求形成了以通用算力、智算算力、边缘算力为代表的多样化算力载体,多样化算力也推动了 CPU、 GPU 、 NPU 、FPGA等算力平台的快速发展。在当前的算力分布中,通用算力和智算算力占据主导地位,通用算力以 CPU 为主要算力平台,智算算力以 GPU 为主要算力平台,在生成式人工智能 AIGC 的技术取得突破之前,CPU 和 GPU 为代表的算力芯片的性能发展趋势一直较为平稳,CPU 约 2.5 年翻一倍,GPU 差不多 2.25年翻一倍;AIGC 技术突破以后,GPU 的性能发展趋势明显加快,已经达到每年 1.5 倍的性能提升速度。
由摩尔定律可知芯片性能的提升主要来源于晶体管数量的增加,参考芯片功耗的主要影响因素公式:P∝C*N*V2*f(P 为芯片功耗,C 为负载电容,N 为芯片的晶体管数量,V 为晶体管工作电压,f 为晶体管工作频率),晶体管数量与芯片的功耗成正比关系,虽然芯片的晶圆制程一直在迭代优化,但是对于芯片功耗控制的边际效应逐步显现,芯片功耗总体上仍呈现明显上升的趋势,以应用最为广泛的算力平台CPU 和 GPU 为例,CPU 的功耗将演进至 600 W 以上,GPU的功耗将演进至 1 000 W 以上,大功耗芯片散热已经成为服务器系统散热设计的主要挑战。
还有一点值得一提的是,在当前地缘政治的影响下,先进半导体制程的限制对我国相关算力发展产生明显影响,而半导体制程对于算力芯片有一个非常大的影响就是散热技术限制导致的功耗限制,例如,在其他条件相同的前提下,以台积电公布的 5nm 制程为基准,芯片性能一致的目标下,7nm 制程芯片功耗将是 5nm 芯片的 2.86 倍。在此大背景下,散热技术对于我国算力行业的重要性更加凸显。本白皮书聚焦服务器相关散热技术,对主流散热技术的现状、特点和技术前景做了汇总分析,并提出了极具技术前景的散热解决方案。充分体现了我国在散热领域具备足够的技术积累,可以有效解决我国半导体技术带来的散热挑战,可以有效应对服务器系统面临的散热挑战,可以强力支撑算力需求发展。
01
服务器散热分析
不同算力芯片的功耗差异较大,如 CPU 比 GPU 的功耗低很多,同样存在散热挑战的核心原因在于算力芯片所处的热边界条件不同。热边界条件是指芯片所在的散热相关的约束条件,如芯片本身的尺寸、封装 形式、功耗分布、温度规格,服务器的硬件架构、空间尺寸、使用环境,散热器的选型、风量大小、冷板设计、液体流量和进出温差等。对芯片散热设计产生约束的信息均属于热边界条件。
以目前业界使用最广泛的 2U 通用服务器和 AI 服务器为例,分析CPU 和 GPU 芯片散热边界的差异。如下表所示,CPU 和 GPU芯片的热边界条件存在较明显的差异,CPU 的散热主要受限于空间和芯片封装设计,而 GPU 的散热则主要受限于多卡级联和芯片封装设计,特别是 GPU 计算模块的计算芯片数量达到 8 颗以上,并排部署,留给每颗芯片可用的散热空间非常有限,也就是说芯片近端的热边界条件对于热设计方案的制定有诸多限制和约束,甚至会限制一些散热技术手段的应用实施,变相加剧了服务器系统的散热挑战难度。

02
服务器散热技术分析
在服务器散热场景下,根据散热工质是否存在相变,散热技术可以分为单相散热技术和两相散热技术,两类散热技术的差异如下表所示,在实际使用中,一个服务器系统中可能出现多个技术混用的情况。例如,目前最常用的风冷换热本身属于单相传热技术,但是芯片使用的热管散热器中的热管部件属于两相散热技术;单相冷板技术也是在服务器风冷散热的基础上针对芯片单独使用的单相冷板散热技术,也属于多个散热技术混用的场景。

单相和两相散热技术各有优缺点,考虑 CPU 或 GPU 这类芯片呈现的高功耗和高热流密度特点,在实际使用中选择散热技术时,可以通过对比传热量和单点热流密度的能力来查看是否满足芯片的散热需求。以 2U 通用服务器 CPU 为例,主要散热技术的性能水平如下图,可以得出以下结论:
(1)2U 通用服务器架构下,单纯空气冷却的传热量和热流密度都是比较小的,所以实际使用中需要借助烧结型铜水热管(两相散热技术)来提升散热器的热流密度和传热量;
(2)烧结型铜水热管,采用的是无源两相散热技术,通过多根排布设计,可以明显改善纯金属风冷散热器面临的热流密度和传热量不足的问题,但是对应的性能上限取决于热管技术本身的性能限制;
(3)冷板式和浸没式为代表的泵驱液冷技术在传热量和热流密度方面相比空气冷却有大幅度的提升,这也是业界大力推广液冷技术的原因;
(4)单相冷板的热流密度要高于单相浸没式,但是传热量指标低于单相浸没式;
(5)两相冷板的热流密度和传热量相比单相冷板有大幅度的提升;
(6)单相浸没式可以和空气冷却一样通过使用热管和 VC 等技术提升热流密度支持能力;
(7)环路热管是两相散热技术中性能最高的散热技术,性能与泵驱液冷性能相当,是一项非常有潜力的散热技术。
需要着重说明的是,冷板式和浸没式散热技术都是芯片近端散热解决方案,芯片近端的热边界条件会对热设计方案产生严格的约束,这也是当前服务器散热挑战成为核心问题的原因,环路热管在具备非常出色的热性能的同时,具备非常出色的热传输性能,可以以很小的温差(≤5℃)把热源大量的热量从近端传递到远端,可以有效减少热源近端的热边界条件的约束,从而大幅度降低服务器系统热设计难度,特别是面对 AI 服务器的使用场景下,是非常有技术前景的一条技术路线。
03
服务器液冷散热技术分析
液冷技术作为一种高效散热技术,在汽车、电力等领域有着成熟和广泛的应用,因此,服务器行业希望通过引入液冷技术来解决服务器芯片散热挑战,目前服务器侧引入的液冷技术主要包含冷板式技术和浸没式液冷技术,每个技术路线还可以分为单相和两相,如下表所示。
冷板式液冷技术可以和风冷服务器保持架构归一,所以冷板式液冷技术对于整个产业链来说更容易接受和推进,单相冷板式液冷技术因为技术成熟使用更为广泛,但是随着芯片功耗和热流密度的增长,单相冷板的性能逐步逼近天花板,具备更高性能的两相冷板液冷技术目前也逐步引起业界的关注。
浸没式液冷技术同样分为单相和两相方案,其中两相浸没式在超算和高性能计算领域一直有广泛使用,对于通用服务器和 AI 智算服务器,单相浸没式液冷技术在系统复杂度、成本等方面的优势逐步成为当前业界探索的主要技术方向。
不管是冷板式还是浸没式液冷技术,在服务器行业推进的时候,碰到了很多新问题和挑战,限制了液冷技术的大规模部署,比如:单相冷板式液冷技术的主要问题是可靠性问题、性能瓶颈问题和成本问题,两相冷板液冷技术可以解决单相冷板的性能瓶颈问题,但是会引入稳定性问题,同时两个液冷系统大多场景下是无法实现平滑演进,即单相冷板液冷系统一般无法直接切换成两相冷板系统使用,这个也是技术路线选择必须要考虑的。对于浸没式而言,不管是单相还是两相系统,核心限制因素主要是兼容性问题和成本问题。下面进行详细阐述。
(一)冷板式液冷技术分析
服务器冷板式液冷技术方案的核心是充分利用冷板式液冷高热流密度的特点,针对性解决芯片散热问题,工质通过管路与安装在芯片上的冷板内部的翅片换热来带走热量。单相冷板的工质可以使用水基、单相氟化液等高沸点工质,两相冷板的工质以两相氟化液或者氢氯氟烯烃一类的制冷剂为主。工质的差异,带来的核心问题也会有不同,实际使用单相冷板以水基冷却液为主,所以会存在因漏液导致的可靠性风险;两相冷板主要使用无水工质,基本不存在可靠性问题,但是两相流的引入则会带来稳定性问题。
另外,常见的服务器冷板式液冷系统分为闭环式(Close Loop)和开环式(Open Loop),其中开环式冷板式液冷系统是当前的主流方案。如下表所示,相比传统的风冷散热器,单相和两相冷板液冷系统的复杂度会变高,故还会存在标准化和成本问题。
可靠性问题的核心是服务器出现泄露时的故障半径和可维修时间的问题。 漏液风险的衡量指标对应平均无故障工作时(MeanTimeBetween Failure,MTBF),出现泄露以后维修时效的衡量指标对应平均维修时间(Mean Time To Repair,MTTR)。 本文统计了目前我国 A 级数据中心的机架式服务器的可靠性指标水平参考(截止 2024.7月的水平,见下表),可以看出,实际使用中 AI 服务器的故障率约是通用计算服务器的 3-5 倍,AI 服务器的主芯片数量约是通用计算服务器的 5-9 倍,风冷散热方案下的板卡维修相对简单,冷板式液冷方案下,大规模上量以后“维修”将成为一个必须考虑的问题。需要注意的是,不同的业务类型或者不同的调度水平对于可靠性指标的约束会存在比较大的差异,如何应对可靠性带来的问题需要根据实际情况综合考虑。
冷板式液冷系统的成本分为显性成本和隐性成本,显性成本主要是指冷板式液冷散热方案的硬件成本,包含冷板、管路、快接头、分水器、冷却液分配单元、阀门等,这部分成本非常显性,也是业界最为关注的, 显性成本通过标准化、国产化等措施有机会降低至可接受水平。隐性成本较为隐蔽,主要是为了应对服务器宕机和维修时间拉长对业务需求造成影响而产生的额外成本支出,主要包含两部分,一部分是服务器的备用机数量增加产生的采购成本,与集群规模、冗余设计有关;另一部分是服务器生命周期内离线和维修带来 的折旧成本,与集群规模、MTBF、MTTR、在线率要求等有关。
AI 算力的强烈需求,导致 AI 芯片的功耗和热流密度出现大幅度的增长,当前主流的单相水冷板技术的性能预计可以解决 1500W 左右的散热,难以满足 2000W 以上芯片散热需求,所以业界开始探索泵驱两相冷板式液冷技术,泵驱两相冷板系统的原理如下图所示,考虑到服务器芯片的工作温度,当前的泵驱两相液冷系统工质以两相氟化液或者氢氯氟烯烃一类的制冷剂为主,所以系统漏液不是主要问题,主要是系统稳定性的问题。

由于泵驱两相系统中汽液两相的存在,泵送两相系统在加热微通道中容易出现不稳定性,例如静态不稳定性(即 Ledinegg 不稳定性)和动态不稳定性(例如气泡快速生长或压降振荡),上图为管内沸腾示意图(冷凝与之方向相反),蒸发器内部的工质从液态吸热变化为汽态,在固体表面被蒸汽覆盖或在沸腾过程中产生的气泡发生合并时,可能出现热传递性能崩溃,称为“沸腾危机”,或者由于两相流不稳定性如密度波振荡(DWO)、压降振荡PDO)和热振荡(THO)引起的“离核沸腾”(DNB)现象,相关的不稳定现象可以参考下图。
虽然两相流本身具备较高的复杂性,但是因泵驱两相液冷技术具备非常优秀的性能,业界对泵驱两相液冷系统的期望也非常高,从OCP 公开的部分结果来看,两相液冷系统相比单相水冷板系统确实体现出更高的性能表现。考虑到当前两相液冷系统使用的工质和当前单相冷板液冷系统使用的工质相差很大,导致泵驱两相液冷系统和现有单相冷板液冷系统存在明显的差异,特别是泵驱两相液冷系统在数据中心大规模部署方案的设计、稳定性、可靠性控制等是当前最为急迫的工作。
需要重点说一下微通道散热技术,冷板式液冷技术的冷板一般为微通道散热器,微通道根据水力直径可以分为 2 个层级:亚毫米级(0.1mm~1mm)和微米级(1μm~100μm),目前学术界普遍认为微通道尺度是介于宏观物理学和微观物理学特别是量子物理理论的过渡地带,微通道内的这些物理过程几乎同时具有宏观物理和量子物理的特点,特别是微通道内的相变传热现象耦合了一系列较复杂的微观热流体动力学过程,目前还没有形成统一的理论体系,所以微通道散热技术仍然是当前学术界和工程界重点探索的热点技术。
总体上来看,冷板式液冷技术的规模商用问题,在产业链上的不同环节看到的限制因素存在巨大差异,服务器制造商认为服务器内部液冷散热方案的成本是主要限制原因,数据中心侧更关注兼容性,而用户侧对性能和可靠性更为关注,如何协同解决冷板式液冷面临的限制是后续业界必须面对的难题。
(二)浸没式液冷技术分析
浸没式液冷技术是将服务器散热所用的工质从空气更换为绝缘液体。 与冷板式的风液混合散热系统相比,浸没式液冷系统最大的优势就是系统简单,可靠性问题并非重点,但是因为工质变化,会导致服务器架构和基础设施架构出现非常大的变化,所以浸没式液冷技术受限的核心问题是兼容性和成本。
兼容性问题不是指浸没式液冷技术对应的材料兼容性问题,而是指服务器系统架构兼容性问题。从整个产业链来看,对于服务器设备供应商而言,风冷和冷板式服务器因为架构兼容,可以实现平滑演进,冷板式液冷技术是服务器设备供应商的必然选择;而浸没式 服务器要对服务器系统架构进行重构,很难做到和风冷散热架构的服务器实现归一化,从而带来服务器架构兼容性问题。
浸没式液冷技术的成本主要体现在两部分。第一部分是资本支出,服务器因兼容性问题需要架构重构会导致成本增加,同时为适应浸没式液冷架构,机房、机柜需要进行重构或重新设计,尤其是绝缘工质带来的成本,相比传统风冷数据中心会有明显的增长;第二部分是运营支出,包含机械吊臂、运维机器人、冷却液清洁、冷却工质的蒸发带来的补液成本、工质回收、环保问题等。
从现有浸没式液冷技术的使用案例来看,浸没式液冷主要用于高性能计算、超算等对投入产出比不敏感的使用场景,在明确要求性价比的使用场景下,成本将是浸没式液冷技术规模应用的最大挑战。
04
无源两相液冷散热技术介绍
与泵驱液冷技术相比,另外一条液冷技术路线是无源两相散热技术,该技术有两个核心技术点:相变传热和无源泵驱技术。核心技术 1—相变传热,主要是流体在发生相变的时候带走的相变潜热,所以对应流体的总换热量为 Q 总换热量 = Q 潜热 +Q 显热 ,相比无相变过程,换热量更大,对流换热系数更高。
核心技术 2—无源泵驱技术,无源泵驱技术是相对有源泵驱而言的,其最大的优点是不需要额外耗能,具有成本低、可靠性高、体积小等优点。在两相散热技术中,无源泵驱技术主要以压力差、重力、密度差、毛细力为主。重力、压力差、密度差相对容易理解,毛细力可能较为陌生,下面详细介绍一下。
毛细现象属于一种液体界面现象,指液体在细管状物体或多孔物体内,由液体与物体间的附着力和因液体分子间的内聚力而产生的表面张力相互作用,令液体在不需施加外力的情况下,流向细管状物体或细缝的现象。玻璃管插入水中,玻璃管内的水柱会高于管外,毛细现象可以让水在无额外动力的情况下,克服重力而上升。
润湿液体具有凹面弯月面(比如水),非润湿液体为凸面弯月面(比如汞),流体弯液面的形状取决于流体的表面张力和固液粘附力。如果粘附力大于表面张力,固体附近的液体将被迫向上,液体的表面张力将保持表面完整,导致整个液体向上移动。当蒸发器中的液体蒸发时,吸液芯中的弯液面的曲率半径减小,当蒸汽在冷凝器中冷凝时,吸芯中的弯液面的曲率半径增加。曲率半径的差异导致毛细管压力,毛细管压力也是由于体积力和相变相互作用造成的。液体和空气界面与管壁的夹角定义为接触角θ,湿润液体的θ是锐角,非润湿液体的θ是钝角。
毛细力的计算可以通过 Young-Laplace 公式进行计算,主要取决于液体的表面张力和毛细通道的直径,所以更大的表面张力(σ为表面张力系数)和更小的毛细通道间隙(rp 为毛细管通道半径)可以提供更大的毛细力(△Pcap),吸液芯在湿点(定义为弯月面平坦的点)和干点(定义为弯月面曲率最大的点)之间产生的毛细管压力为毛细力的最大理论极限值(△Pcap-max)。
目前,无源两相传热技术主要包含热管、均温板、热虹吸、环路热管、脉动热管等,其中脉动热管以压力差为动力,热虹吸管以密度差和重力为动力,热管、均温板、环路热管以毛细力为动力为主。
在目前服务器领域中,以热管和均温板应用最为广泛,热虹吸技术和环路热管有初步探索,但是没有规模落地使用,脉动热管因为技术特点,目前成熟度较低,属于 N+2 代次技术,短时间内落地的可能性较小,所以本文主针对 N 代次和 N+1 代次的技术做介绍。
05
热管
(一)热管机理
Gaugler 于 1942 年提出了热管的概念,但是直到 20 世纪 60 年代早期,Grover 重新独立发明和测试了热管,指出热管具有远远超过任何一种金属的热传导性,使得热管得到广泛认识,引发了热管装置的飞速发展。热管发展初期,美国与欧洲研究主要集中于热管在空间工程和航天中的应用,专注于高温热管,并取得了大量的研究成果Cotter 在 1965 年首次提出了较完整的热管热传导理论,为以后热管理论的研究奠定了基础。1967 年,一根用电加热的水-不锈钢热管首次被送入地球卫星轨道并成功运行。后来人们对于不同材料组合热管进行了长时间(9000h)的可靠性究,得出了热管相容性材料的选择范围,我国从 20 世纪 70 年代开始,开对热管的研究和应用工作。
热管具备非常高的传热性能,传热部件的性能可以通过有效导热系数(keff)或热阻(Rth)来表征。例如,长度为 0.5 米、直径为 1.28厘米的铜水热管的有效导热系数典型值约为 10000 W/(m*K),远大于铜铝等常见导热金属的有效导热系数,对应热管具备非常低的热阻。当施加 20 W 热量时,该热管将在热源和散热器之间产生 6°C 的温差(和热管设计水平有关),而具有相同几何形状的金属棒对于铜和铝来说分别具有 206°C 和 460°C 的温差。
典型热管是在封闭真空管内填充工作液体,利用液体的蒸发和液化相变转换进行热传导,把热量从一个不易传热的位置转移到另一个可有效散热位置的高效热转换元件。如图 7-2 所示,热管的一段为蒸发段,另一端为冷凝段,可以根据需要把绝热段布置在两段中间,当蒸发段受热时,吸液芯中的工作液体吸收热量后蒸发为气体;蒸发段的蒸气压力高于在冷凝段的平衡气体压力,所形成的压力差迅速推动蒸汽向冷凝段流动,气体在冷凝段内的气液分界面上转换成液体并释放出大量的热,液体再沿多孔材料靠毛细力的作用重新流回蒸发段,如此循环往复,从而实现高效热传导。
热管要想正常运行,最大毛细力一定要高于热管内部两相循环链
路上的总压降,如下。
ΔPcap≥ΔPl+ΔPl–v+ΔPv+ΔPg (公式 7-1)
ΔPcap:蒸发器和冷凝器部分之间的毛细压力差。
ΔPl:液体从冷凝段返回到蒸发段在毛细芯的流路压降。
ΔPl–v:相界面逆流施加的附加压降。
ΔPv:蒸汽从蒸发段到冷凝段所需的蒸汽流路压降。
ΔPg:重力引起的压降,取决于热管倾角,该值可为零,正值或者负值。
从结构上来看,热管主要由毛细芯、外壳和工质构成,毛细芯可分为均质毛细芯或复合毛细芯。均质毛细芯由单一材料和结构组成,最常见的均质吸芯类型是缠绕筛网、烧结金属和轴向沟槽。复合毛细芯由多种材料或者不同毛细结构配置组成,最常见的复合毛细芯类型有可变筛网、筛网+沟槽组合、沟槽+烧结金属组合等。无论毛细结构如何,热管毛细结构所需的材料特性和结构特征是高导热率、高毛细孔隙率、小毛细管半径和高毛细渗透率。
根据提供毛细力结构的不同,主要的热管类型:铜-水烧结型热管和组合式热管在服务器产品上使用最为广泛,丝网型热管更多的用在个人电脑和消费级产品中,单纯的沟槽型热管在航空航天领域用的比较多,在服务器产品上用的相对较少。
对于热管的外壳和内部工质的选择,则主要考虑工质的工作温度、外壳和工质的相容性。不同温度场景下的工质的工作温度范围和对应压力。外壳和工质的相容性,最核心点考虑是不产生不凝性气体。
(二)热管的主要技术痛点
热管作为一种高效的两相流换热部件,主要会受到以下 5 个方面的物理限制。毛细极限、粘性极限、夹带极限和声速极限影响的是轴向传热能力,沸腾极限影响的是径向热通量极限(热流密度)。
(1)毛细极限:循环回路的总压降不能超过吸液芯的最大毛细力,当毛细压力太低而无法从冷凝器向蒸发器提供足够的液体时发生,导致蒸发器干涸,干燥会阻止热力循环的继续,并且热管不再正常工作。
(2)粘性极限或蒸气压极限:蒸气压降不能超过蒸发段和冷凝段之间的饱和压力差,如冷凝段和蒸发段之间的蒸气压差不足以克服粘性力,来自蒸发器的蒸汽不会移动到冷凝器,不会发生热力循环。
(3)声速极限:当蒸汽速度在蒸发器处达到声速,并且压差的任何增加都不会加速流动时,就会出现声速极限,对于服务器常用铜水烧结型热管基本上不会受影响。
(4)夹带极限:逆流液体和蒸汽流之间的强烈相互作用导致液体从吸芯表面剪切并在到达蒸发段之前返回到冷凝段。
(5)沸腾极限或热通量极限:当进入热管的径向热通量导致吸芯中的液体沸腾产生蒸汽泡,会阻碍液体回流,破坏蒸发器中稳定的毛细管弯月面。
目前服务器使用最多的热管为铜水烧结型热管,这类热管具备技术成熟,性能稳定等优点,但是缺点也非常显著,就是轴向传热能力有限,铜水烧结型热管的传热能力主要受限于 2 个极限,一个是蒸汽压极限(粘性极限),一个是毛细芯极限。当热管管径达到 8mm 以上(打扁厚度 4mm 以上),主要是毛细芯极限影响热管的传热能力。对于毛细芯极限,烧结型热管的毛细力来源于金属粉末高温烧结形成的多孔介质,计算遵循 Young-Laplace 公式,对于多孔介质的渗透过程的动力为毛细压差的时候,则对应毛细渗透,此处的稳定渗透过程满足达西定律。当前铜水烧结型热管使用的铜粉烧结型吸液芯的有效毛细半径与烧结颗粒的大小、填充方式等因素有关,孔隙率较小(一般为 30%~50%),为了提高毛细力,需要使用较小的金属粉末进行烧结,但是较小尺寸的金属粉末(金属粉末尺寸一般为微米级),会导致渗透率 K 较低,则会导致较大的回液阻力,所以渗透性和毛细作用的相互矛盾是导致当前烧结型热管的传热能力受限的最主要的原因。
对于热管毛细结构对应的最大传热量的计算可以参考如下公式:
Qmax=(2*σ*hfg*ρl/μl)(Aw/Leff)(K/Reff)式中,σ为表面张力系数,hfg为工质潜热系数,ρl 为工作流体的液体密度,μl为工作流体的液体粘度,Aw为吸液芯横截面面积, Leff为热管有效长度,K 为渗透率,Reff为吸液芯结构的有效孔隙半径。σ、hfg、ρl、μl为流体属性,Aw、Leff代表热管的宏观几何形状相关,K/Reff主要体现毛细芯的微观结构,沟槽热管的传热极限在理论上至少是烧结型热管的 3 倍,同时具备易加工,成本低的特点,是解决当下烧结型热管传热量不足的一个非常有前景的技术路径。
对于工作流体的选择,主要有以下几个原则:(1)考虑到系统的机械完整性,工作温度范围应对应于有限的饱和压力;(2)三相点温度应低于回路运行中遇到的最低温度。环路热管运行期间不应达到临界点温度;(3)汽化潜热应尽可能高,以通过小流量传递很大的热量,同时可以降低系统内部的压降;(4)表面张力应尽可能高,以提供大的毛细管压力;(5)蒸气密度应尽可能高,以抑制蒸气速度,从而抑制产生的压力损失;(6)蒸气和液体的动力粘度都应较小,以减少压降;(7)流体应化学稳定、无腐蚀性且尽可能纯净,以防止环路热管运行期间产生不凝性气体;(8)大规模民用,还需要考虑环境和安全等方面的限制。
热管的热性能与流体特性(σ*hfg*ρl/μl)成正比,这通常称为工作流体的品质因数。在常温使用环境下,水是品质因数最高的液体,在服器芯片工作温度范围内,水的品质系数是其他常见工质的 10 倍以上,这也是铜水热管在服务器散热领域广泛应用的核心原因。
(三)热管的技术现状
目前服务器使用最多的是铜水烧结型热管(包含复合型热管),该类热管的外壳为铜,工作液体为水,工作压力位负压,核心工艺为毛细结构制备和真空注液,毛细结构的制备涉及粉剂配方、填充、烧结等工艺技术,真空注液涉及真空度能力和精度、液体封存精度等工艺技术。早期热管技术(铜水热管)主要掌握在美国和日本厂家手里,后来台湾厂商崛起并成为热管技术的主要提供商并保持至今,我国近10 年热管制造技术取得显著进步,热管的理论技术研究、制造工艺、自动化技术等表现出明显的后发优势,已经完全具备生产自主可控的热管产品,相关产品的性能和质量达到国际领先水平。
服务器系统当前应用热管的技术现状如下:
(1)当前服务器使用最多的是铜水烧结型热管,低性能热管以纯烧结型居多,高性能的热管以沟槽+烧结型的为主;
(2)热管直径以 D6 为主,D8 甚至 D10 逐步进入主流场景;
(3)热管的打扁后的厚度一般≥4mm,以尽量保持足够的性能;
(4)热管的弯折、拉远应用场景很多,对于热管的轴向传热能力要求比较高。
通过对业界热管厂商的技术调研,结合现有 Intel 和AMD 的服务器用 CPU 对应的散热器尺寸边界条件,可以估算出现有铜水烧结型(含组合式)热管的散热极限水平,宽度 92mm 散热器(采用铜水烧结型热管)的最大散热能力约 660W,当然此数值随着热管技术的进步会进一步提升,但是总体上来看,单纯依靠现有热管技术是很难满足 1000W 量级 CPU 的散热需求的。
(四)热管的发展趋势
考虑服务器散热场景对热管的需求,热管未来的发展方向主要以提升传热性能和构型优化为主。热管散热器希望热管可以把热量按照需求传递至所需要的地方,同时热管本身的温差可以尽量的小,就要求热管轴向传热性能可以保证上述这些需求的达成,不管是弯折、拉远、打扁等。增大热管传热能力主要有 2 项措施:一是扩展蒸发传热表面;二是优化槽道热管几何尺寸。
在扩展蒸发传热表面的研究方面主要体现在毛细芯技术研究,其中以复合毛细芯技术研究为主,复合毛细芯技术主要分为多孔隙复合毛细芯技术和沟槽+烧结型的复合毛细芯技术。
多孔隙复合吸液芯在毛细结构中有多种大小不同的孔洞,大孔洞能减小流动阻力有效帮助液体的回流,小孔洞能提供大的毛细力为液体回流提供压力,多孔毛细结构可以采用组合丝网芯结构:(1)在接近管壁的内层使用大孔眼网,在大孔眼网的外面再用小孔眼网覆盖;(2)采用大孔眼网和小孔眼网交替层叠而成的吸液芯。
沟槽+烧结型的复合毛细芯技术,特别是沟槽热管相关的技术可以借鉴航天领域方面的技术积累,比如 Vasiliev 等提出了在梯形槽道增加多孔薄层的方法提高毛细力和扩展蒸发面积。Wang 和 Catton 的分析研究表明,三角形槽道内增加多孔薄层时,蒸发传热能力可增强3~6 倍。Vasiliev Jr 等通过对Ω形槽道热管增加多孔薄层的试验研究表明,在热管蒸发段布置多孔薄层,冷凝段不布置多孔薄层时,具有更大的传热能力,
在优化槽道热管几何尺寸的研究方面,主要是现有的矩形或者梯形沟槽向Ω形槽道技术演进,Ω形槽道技术在航天领域已经证明具备更高性能,比如,俄罗斯和美国联合研制的Ω形槽道热管的最大传热能力提高了 50%以上;中国空间技术研究院总体部研制的 Ω 形槽道热管比矩形和梯形槽道热管传热能力普遍提高了 2 倍以上,相关槽道结构的优化思路对于复合热管技术的改进具备非常好的借鉴意义。
热管构型的优化主要是指热管在热源处的排布,在大功耗和有限面积边界下,如何进行热管排布对最终的散热方案有非常大的影响,此时热管本身的构型优化也变的非常重要,比如方形热管、辊压工艺、热管面铣平等。
最后说明的是热管中的烧结芯内的通道尺寸以微米级为主,属于典型的微通道散热技术,微通道内的这些物理过程几乎同时具有宏观物理和量子物理的特点,一般认为,水利直径大于 50 微米以上的时候,微通道内的热流体动力学过程仍然遵循连续介质假设,可以使用古典宏观物理学理论,50μm 以下的微通道内的微热流体动力学过程更多的具有量子力学的特点,其背后理论体系的探索仍然需要学术界和工程界继续努力。
06
均温板技术
(一)均温板机理
由于许多设备的表面是平面,为满足此类设备的散热需求,1969年,Sheppard 首先设计出一种用矩形断面的热管来冷却集成电路的底板,在此研究基础上,Feldman 提出了均温板,将吸液芯结构化,使得工质在吸液芯提供的毛细压头作用下能够实现在密闭空间的循环流动,获得了美国专利局的专利授权。随后均温板被广泛应用于微电子器件、空间热控制等领域。
均温板由密闭容器、毛细结构和工作流体组成,为保证均温板具有高效的换热性能,通常外壳采用热导率较高的材料,内壁四周附着吸液芯,为满足耐压需求,一些均温板内部设计有实心柱、烧结柱或在实心柱外表面附着吸液芯形成烧结环,如图 8-1 所示。当均温板底部施加热量时,液体随热量增加而蒸发,蒸汽上升到容器顶部产生冷凝,依靠吸液芯回流到蒸发面形成循环。均温板相比于传统热管轴向尺寸大大缩短,减小了工质流动阻力损失以及轴向热阻。同时径向尺寸有所增加,显著增加了蒸发面和冷凝面的面积,具有较小的扩散热阻和较高的均温性。
均温板的厚度远小于宽度,通过内部腔体实现二维平面传热,所以采用烧结芯的均温板一般也称作 VC(Vapor Chambers),VC 具备更高的热流密度,一般支持的热流密度高于 60W/cm2,特殊设计可以高达 750W/cm2。
(二)均温板的技术现状
均温板主要分为 2 类,第一类是采用毛细力作为动力,以铜水烧结型和丝网型为主;第二类是以重力作为动力,以使用制冷剂的吹胀板为主。
近年来随着对散热器高度方向的散热能力提升需求, 3DVC 技术也逐步出现工程应用,常见的 3DVC 技术主要有 3 个技术路径。
(三)均温板的主要技术痛点
VC 技术本身应用范围广泛,在 CPU 和 GPU 算力场景均可应用,但是在 Intel 和 AMD 的服务器芯片应用较少,主要受限于 VC 的最大工作温度和刚度。
技术难点一:VC 的工作温度问题。 烧结型 VC 的工作温度一般要求低于 110℃,现有 VC 的设计是上下两个 0.5 mm 厚度的铜片,内部空腔配合支撑柱和铜粉烧结而成,温度超过 110 °C 以后,蒸汽腔内的压力增大至高于大气压,导致 VC 出现变形。当前的优化技术主要是扩散焊接和一体式 VC 技术,可以将最大工作温度提升至140 °C 。
技术难点二:VC 的刚度问题。Intel 和 AMD 服务器芯片为了兼容多个型号,芯片与主板互联采用的是 LGA 封装,与常见的球栅阵列(Ball Grid Array,BGA)封装形式相比,LGA 随着触点越来越多,对芯片的安装压力要求也越来越大,VC 想要满足LGA 封装未来的刚度要求会面临非常大的挑战,目前业界解决此问题的主要路径有两个:路径 1 是 VC 的外壳使用黄铜合金、不锈钢等更高刚度的材质;路径 2 是在 VC 外围增加结构件进行强度加强,比如增加不锈钢支撑件等。
(四)均温板的发展趋势
与热管主要用于热量拉远的目的不同,均温板的冷凝端和蒸发端距离通常距离较短,所以实际使用中一般不会受到毛细力极限的限制(超薄 VC 除外),主要受到沸腾极限(热通量极限)的限制,所以均温板的发展趋势主要在于提升沸腾极限。 早期应用的 VC 是最经典的纯金属支撑柱式,支撑柱仅发挥结构加强的作用。之后演变出在支撑柱外套一层粉末烧结毛细环,或直接将金属柱换成毛细粉柱,采用纯毛细柱排列或金属柱与毛细柱混合排列。这样在冷面凝结的工质可以通过毛细环或毛细柱向热面蒸发区回流,回流路径大大缩短,补液速率增大,VC 传热能力因此增强。
更高性能的VC多见对应于热源位置的蒸发区局部毛细结构体加密,除了增强毛细力和液体回流,这些毛细结构体表面同时扩展了蒸发面积,提高了蒸发速率。从这一角度出发的设计还有加密纯金属结构体外部覆着一层毛细材料,因纯金属尤其纯铜的导热系数要高于毛细结构,内部纯金属将热量传导至表层毛细结构效率更高,且纯金属的强度也更好。这类设计型式多种多样,VC 热流密度承载能力可以达到 30~100W/cm2。
当前 VC 多采用均质毛细芯,随着芯厚度的变化,最大支持热通量和热导率之间存在内在权衡,为此,业界探索通过非均质毛细芯形态来规避这些限制,通过提供单独的液体流动和蒸汽提取途径可以提高在高热通量下运行的蒸发器芯的性能,比如这种异质芯可能包括图案化特征以方便蒸汽去除,并提供专用的液体供给通道以防止在毛细管供料沸腾操作期间干涸。如图 8-6 所示,例如刻蚀加工的放射状槽道结构,液体通过蒸发层和一系列横向收敛通道向热源区域补充,大幅度提升了 VC 的热流密度承载极限。或采用仿生式设计,借鉴植物叶脉结构所独有的传热传质机制,有效平衡渗透率与毛细力的矛盾问题,获得更低的热阻和优良的均温性。
此外,双孔芯,混合芯,甚至无毛细芯的 VC 也是 VC 技术的探索方向。
07
热虹吸技术
(一)热虹吸机理
热虹吸技术的循环动力为密度差和重力,内部不需要吸液芯,依靠重力的作用使工作液体从冷凝段回流到蒸发段。由于结构简单、制造方便、成本低廉,热虹吸管是使用广泛的一项技术。实际应用主要分为 2 种形式,分为闭式热虹吸管和分离式热虹吸循环管两种形式,但是不管是哪种形式,由于依靠重力实现液体回流,冷凝段必须要高于蒸发段。在热性能方面,热虹吸技术在传热量方面相比同尺寸的热管要大很多,。
(二)热虹吸管的技术现状
闭式热虹吸管最著名的应用就是冻土层的应用,比如青藏铁路两侧的铁棒,实际上就是一种闭式热虹吸热管。分离式热虹吸管实际应用也非常广泛,其中环路热虹吸管(LTS)在空调领域,电力行业都有成熟应用。
在服务器系统中,热虹吸技术的应用主要是以热虹吸散热器的形式存在。国内的腾讯、百度联合 AVC 等散热器厂家曾经对此技术进行过探索研究,但是因实际使用效果收益有限,所以目前未实现规模应用。
(三)热虹吸管的主要技术痛点
热虹吸散热器在服务器系统实际使用中主要存在四个问题:
(1)安装要求:散热器需要有一定的安装角度,冷凝端在上,蒸发端在下;
(2)工作温度要求:存在温度极限,低温可能会出现冻结,高温可能会全部汽化,和使用工质有关;
(3)启动要求:需要大温差启动沸腾,小温差场景下,容易出现气液混合导致启动不良,也是限制使用的核心问题;
(4)散热面积问题:热虹吸蒸发端一般不配置翅片,热量导出以后的集中式散热器的散热面积要比较大,对于服务器的空间和尺寸有要求。
(四)热虹吸管的发展趋势
对于热虹吸技术的问题,技术优化主要集中在沸腾启动的强化和驱动力的增强等方面。其中毛细力的辅助增加会有效改善散热特性,比如在蒸发段增加烧结芯,可以提高散热性能,同时降低充液量,减少因冻结而导致的结构损坏风险等。
08
环路热管技术
(一)环路热管的机理
环路热管是一种非常高效的两相传热装置,利用蒸发器内的毛细芯产生的毛细力驱动回路运行,利用工质的蒸发和冷凝传递热量,可以在小温差、长距离的情况下传递大量的热量(>10KW 量级)。最初的环路热管是前苏联乌拉尔科技学院的 Gerasimov 等在 1972 年发明并申请专利,此后美国、中国和欧洲陆续开始发展该技术,早期环路热管主要运用于宇宙航空航天领域,如表 10-1 所示。环路热管技术因其在性能和可靠性方面的突出特性,近年来一直是学术界和工程界重点关注的前沿技术之一。
典型的环路热管,与常见的热管结构差异很大,最明显的变化就是环路热管的汽/液管道是分离的,且管道无毛细结构,蒸汽和液体各自在光滑管道中流动,在避免汽液逆流夹带的问题的同时有效降低沿程阻力损失,可以支持更远的热传递距离。另外环路热管只在蒸发器有毛细结构,毛细芯和管道分离,毛细芯的尺寸不受管道直径限制,毛细芯的泵压比热管高 1~2 个数量级以上,可以有效提高传热能力和反重力能力。通过上述设计,可以有效解决现有热管存在的传热量小、传热距离短和反重力能力弱的问题。
环路热管主要包含蒸发器、冷凝器、汽管、液管、储液器或者补偿器组成。环路热管的工作过程如下:蒸发器从外界吸收热量,是内部的工质汽化,同时在气液界面上产生弯月面,形成毛细力,产生的蒸汽经蒸汽管道进入冷凝器,并在冷凝器内凝结成液体,放出热量,凝结后的液体在毛细力的驱动下经液体管道重新回到蒸发器内,并以此种形式在回路内往复循环不已,这样回路内的工质便以相变传热的形式不断的将热量自蒸发器传向冷凝器,液体补偿器内储存一定量的液体工质,可以向蒸发器补偿其所需的工质,液体补偿器可起到控制运行温度的作用,冷凝器气液界面变化时可以接纳多余的工质或者向其注入工质。
环路热管正常工作的前提条件是蒸发器芯中产生的毛细管压力大于回路中的总压降,环路热管中的总压降是蒸发器凹槽、蒸汽管线、冷凝器、液体管线、蒸发器芯中的摩擦压降和由于重力引起的静压降之和:
ΔPcap≥ΔPtotal=ΔPgrove+ΔPvap+ΔPcon+ΔPliq+ΔPw+ΔPg (公式 10-1)
典型环路热管的全链路的压力分布,P1 和 P7 的差值代表毛细力,主要的变量是重力,不同的重力场景下的压力表现,反重力场景下需要更大的毛细力,重力辅助场景下,需要的毛细力更小。
环路热管同样会受到运行过程中涉及的物理现象及其运行规范相关的限制,但是这些限制的程度和特征与传统热管有明显差异。声速极限在理论上是相关的,但可以通过合理设计蒸汽管线和蒸汽通道的尺寸来避免;夹带极限在汽液管道分离的环路热管中相关度也较低,大部分场景下都不会成为限制;所以环路热管主要受到毛细极限、蒸气压极限和沸腾极限的限制。
(二)环路热管的技术现状
环路热管由于从原理上带来的灵活性,实际上应用中有很多的技
术方案,目前主流的技术路线主要分为 2 类:LHP和 CPL,LHP 和 CPL 的主要差异点:LHP 的液体补偿器必须在物理上非常靠近蒸发器,因为它们直接或通过相对较弱的毛细管连接共享流体。这一要求可能会导致集成困难,因为液体补偿器通常相对较大,同时液体补偿器对热量增益很敏感,在某些应用中,将蒸发器和液体补偿器组件封装在热源旁边可能很困难。CPL 的液体补偿器通过一条直径非常小的、可以任意长的管线连接到蒸发器,同时 CPL 中的液体补偿器对热泄漏并不那么敏感。因此,CPL 比 LHP 更容易集成。LHP 比 CPL 更简单且通常更稳健。
随着环路热管技术使用场景增多,为了更好的适应电子器件冷却需求,蒸发器从圆柱型逐步演进至平板式。对于工质的要求可以参考热管工质选择的原则,水仍然是服务器应用环路热管技术最为优选的工质,单纯从工质的品质系数来看,工质差异对散热能力的影响甚至可以达到 10 倍以上。
(三)环路热管的主要技术痛点
环路热管技术不管在学术界还是工程界,目前仍属于散热领域的前沿技术,呈现“会做的少,用的更少”的特点。
“会做的少”主要体现在,目前环路热管的工程化能力主要掌握在美国、俄罗斯、欧盟和中国手中,其他国家和地区主要以学术科研为主。“用的更少” 主要体现在,当前环路热管技术的使用场景以宇航领域的航天器为主,手机产品上有少量使用,服务器产品上规模应用的案例非常少。
现有航天级环路热管的设计方案应用于民用电子冷却领域,面临最大的问题是要根据民用电子冷却需求进行对应的适配设计,不管是构型设计、工质选择、整体结构部署方案、甚至加工制程等等。
以智算算力服务器为例,采用环路热管无漏液液冷系统方案,可以通过环路热管技术将多颗 GPU芯片的功耗传递到专用的集中式水冷散热器或者集中式风冷散热器,芯片热量搬运路径由水管更换为环路热管,可以有效规避液体上板带来的泄露导电风险,同时通过集中式散热器的设计实现服务器可风可液的兼容性设计,解决液冷技术面临的可靠性、兼容性、成本等限制难题。
以环路热管+集中式水冷散热方案为例,一个GPU 芯片对应一套环路热管,环路热管的蒸发器侧和芯片热源接触,冷凝器和水冷器接触。环路热管的冷凝器优选全部部署在水冷器的上部,便于拆装和运维,可以实现单个 GPU 运维,不影响其他 GPU,无需拆卸水冷器。水冷器本身的设计比较灵活,可以根据系统设计需求,设计为 1 拖多的形式,比如 1 拖 2(1 个水冷器对应 2 颗 GPU 芯片),1 拖 4(1 个水冷器对应 4 颗 GPU 芯片),水冷器设计方案主要受到进水流量、水冷器内部流道和压降、系统空间、成本等多个方面的影响。冷凝器和水冷器之间推荐填充热界面材料以降低接触热阻。
环路热管应用于 GPU 散热解决方案的优点可以概括为“四高一
低”。
(1)高性能:环路热管的内部工质为水,与氟化液或氢氟烯烃
(HFOs)等工质相比具备更高的品质系数,从而为环路热管带来优异的散热性能,在解决单相水冷面临的性能瓶颈问题的同时,可以提供更高的性能演进能力(3000W 以上功耗演进能力);
(2)高可靠性:环路热管为负压运行,本身具备非常高可靠性;水冷器不上主板,配合水冷器的无漏液加工工艺,基本杜绝漏液风险,液冷方案的可靠性可以达到风冷散热方案;有效解决现有水冷板存在的可靠性难题;
(3)高通用性:环路热管的传热距离相比热管有明显提升,可以将现有近芯片端散热解决方案面临的问题通过热源拉远的方案来解决,有效解决芯片本身带来的尺寸、空间等热边界条件的限制。相比现有水冷板液冷技术,专用水冷器可支持的更高散热需求,可采用的强化散热的手段更为丰富,与采用微通道的冷板液冷系统相比,集中式专用水冷器对工质循环系统在导电率、过滤净化、泵压等方面的要求大幅度降低,有效提高方案通用性;
(4)高兼容性:环路热管负责把热源拉远,集中式散热器负责把热量带走,集中式散热器可以是风冷也可以是液冷,支持 AI 服务器散热方案实现可风可液的兼容设计;同时可以复用现有 Open Loop冷板式液冷系统的相关设计和标准,比如手动快接头、分水器、整机柜盲插、CDU、液冷环路设计和控制等,可以实现对冷板式液冷技术的平滑演进支持,对于数据中心机房的规划设计、部署、运维等更加友好;
(5)低成本:环路热管+水冷器的系统方案相比现有水冷板液冷技术方案,系统复杂度大幅度降低,结合机房侧液冷系统的简化,整体液冷系统成本预计会有大幅度下降,更有利于大规模部署。
(四)环路热管的发展趋势
环路热管技术作为新一代的高性能无源两相散热技术,具备非常好的灵活性,未来的发展与应用领域有很大的关联,以当前服务器应用需求来看,环路热管技术未来主要有两个发展方向。
第一个方向是分体式环路热管技术,蒸发器和冷凝器在空间上明显分开,该技术方向具备非常高的性能,从当前主要算力芯片的功耗演进趋势来看,预计 2030 年,芯片散热需求会达到散热量 3000W 和 200W/cm2 的热流密度,所以环路热管未来也将沿此需求演进。
第二个方向是单体式环路热管技术,该技术可以替代现有热管散
热器或者 3DVC 散热器,采用环路热管技术,可以有效改善现有散热器存在的几个问题,比如热管散热器的传热量不足、3DVC 热管散热器加工困难和成本较高等问题。
最后需要说明的是,近年来,随着我国对空间站、探月等空间技术的持续投入,我国的环路热管技术发展迅速,已达到国际先进水平。借助环路热管在航天领域的多年成熟应用,结合国内服务器市场规模和供应链优势,未来非常有希望在服务器领域实现规模商用,有效解决芯片散热难题。
09
其他无源两相散热技术介绍
除了上述提到几种常用的无源两相散热技术,还有一些相对不常
用的无源两相散热技术,比如脉动热管、微型热管、泵辅助毛细环路热管技术等,下面予以简介。
(一)脉动热管技术

20世纪90年代初日本的Akachi提出一种新型两相散热技术——脉动热管(PHP),由金属毛细管弯曲成蛇形结构,弯头一端为加热段,另一端为冷却段,在中间任意位置设计绝热段,根据管路的走向,脉动热管分为回路型、开路型和 带控制阀的回路型 3 种。
脉动热管内部无需吸液芯结构,利用蒸发段与冷凝段之间的压差以及管中存在的压力不平衡,使得工作液体产生自身震荡,从而加快气液交流,快速传递热量。为了运行,PHP 必须利用毛细管力形成液体和蒸汽段塞。
Akachi 和 Polasek 描述了 PHP 的基本原理:当波状毛细管的匝束一端受到高温时,内部的工作流体蒸发并增加蒸气压,导致蒸发器区的气泡生长,这将液柱推向低温端(冷凝器)。低温端的冷凝会进一步增大两端的压差。由于管子相互连接,管子某一部分的液塞和气泡向冷凝器的运动也会导致下一部分的液塞和气泡向高温端(蒸发器)的运动,这起到恢复力的作用,恢复力导致汽泡和液塞沿轴向振荡。振荡的频率和振幅预计取决于管中液体的热流和质量分数,热量可以从加热部分传递到冷却部分。
PHP 由一束连续的毛细管组成。毛细管的直径必须足够小,以允许液体和蒸汽塞共存。 对于这种情况,Akachi 和 Polasek (1995)将最大直径通过公式确定,对应水工质的 d<5.34mm,乙醇 d<3.25mm。脉动热管具有结构简单、体积小、传热性能好、适应性强的优点,受到各国学者的普遍关注。但实际上脉动热管的运行机理相当复杂,受到多方因素的影响,其内部气液两相流动和传热现象错综复杂。因此,人们着力于脉动热管可视化实验,并据此进行理论与数值分析。
PHP 的优点是无源且不需要毛细结构来输送液体。虽然脉动热管的总阻力通常大于传统热管的总阻力,但脉动热管可以在更高的热通量下运行,因为系统利用沸腾并且不受临界热通量以外的沸腾限制的限制。
目前广泛使用的脉动热管散热器有以下几种形式:翅片式脉动热管、柔性连接热管及平板式脉动热管等。脉动热管已被成功应用于电力设备及微电子器件的散热。
(二)微型热管技术
微热管的概念最初是作为一种在半导体器件中提供更均匀的温度分布从而消除这些器件产生的局部热点的方法而提出的,微小型通道具有换热系数高和单位流动体积传热面积大的优点,散热流密度可达 100~1000W/cm2。
这些微型热管由通常为尖角几何形状(例如三角形)的无芯非圆形几何形状形成内部通道,水力直径约为小于 1000 µm(或者小于0.5mm)。由于直径较小,一般不采用传统的毛细结构来增强毛细力,通常通过锋利的尖角充当液体动脉,并提供支撑液-汽界面所需的毛细管结构,边缘和拐角的差异会影响 MHP 内部的流动蒸汽状态。自最初提出以来,已有多项研究针对微热管概念。最初的研究主要集中在特征尺寸为 1.0 mm 量级的微型热管上并提供了对传统热管和微型热管之间预期发生的根本差异的深入了解。
使用化学蚀刻和气相沉积技术在硅片上构建了特征尺寸为 30 至100 微米量级的微型热管阵列。这些微型热管阵列已经在稳态和瞬态操作中进行了测试,并通过降低最大表面温度或热点,从而在晶圆中提供更均匀的温度分布,证明了相对于普通硅晶圆的显着改进。 这些测试证明了微热管的概念是可行的。
在电子应用中使用微热管之前,必须解决几个问题。这里包括确定存在的工作流体的量对操作性能的影响以及确定操作期间微热管内工作流体的分布。在传统的热管中,所需的工作流体的量由芯吸结构在热管的工作温度范围内有效饱和的要求来控制。由于微热管中的尖角区域充当毛细结构,因此不容易确定最佳性能所需的工作流体量。对微型热管充液不足和过度充液都会导致热管性能严重下降。工作流体的位置本质上非常复杂,由微热管的几何形状、工作流体的量和相应的热量输入决定。随着热输入的增加,由于需要更大的毛细管泵送要求来将液体从冷凝器输送到蒸发器,因此蒸发器区域中的液体弯月面后退到尖角中。由于微型热管包含固定量的工作流体,因此蒸发器中减少的质量必须对应于冷凝器中增加的质量库存。然而,随着弯液面后退,液体可以流动的面积减少,导致增加阻碍液体回流的摩擦力。液体流动面积可能沿着微热管的长度发生变化,使得性能评估进一步
复杂化。
工作流体的量不仅影响热管内工作流体的分布,而且显着影响热管的最大性能。如果热管过度充液,则传热阻力会增加,因为热量必须穿过额外的流体,并且实际上可能导致系统的传热特性比没有热管时的系统差。类似地,如果热管充注不足,则液体流动通道尺寸可能减小并导致液体中的摩擦损失增加。必须存在最佳的冲液量,以实现微热管的最大性能。
与传统热管相比,微热管具有以下优势:(1)可直接镶进硅基板中,减少电子模块与热沉之间的接触热阻;(2)可最大限度地降低热点部位温度,芯片表面温度分布更为均匀;(3)基于 MEMS 技术可实现与电子芯片的集成加工,并批量生产。
虽然微型热管具有较大优势,但在基础研究和应用方面,仍需要大量研究,主要包括:(1)充注封装方法的改进与优化;(2)微尺度相变换的机理研究,如热管内相变行为、润湿和再润湿过程、气液两相流和传热传质等,掌握各种参数对热管传热极限的影响规律;(3)新型流动工质在热管中的应用,如纳米流体、自湿润流体等;(4)降低加工制作成本,应减少复杂的成形工艺或材料的使用,并应用相对简单有效的手段来加强换热性能,如碳纳米管、功能性表面、湿度梯度能利用等。
(三) 泵辅助毛细环路热管技术
机械泵对毛细泵进行辅助的环路热管技术,一般称为泵辅助毛细环路热管技术,另一类是机械泵直接替换掉毛细力的泵驱环路热管技术,也就是泵驱两相循环系统,
需要注意的是,机械泵对毛细泵进行辅助的环路热管技术,在不同的文献中各不相同,名称包括混合毛细管泵送回路、泵送辅助毛细管驱动两相回路、混合回路热管或机械毛细管驱动两相回路等,为了保持一致性,本文采用术语泵辅助毛细管环路(PACL)来描述这些系统。

泵位于液路回路上,主要用于蒸发器的回液辅助,整个环路的动力在毛细力的基础上增加了一个额外的泵辅助动力,相当于可以突破毛细极限的限制,提高整个系统的热性能,所以 PACL 可以做为环路热管技术的增强版。因为原理上的差异,对于当前的服务器系统而言,PACL 和环路热管均可以使用水工质,而泵驱两相液冷系统目前无法使用水作为工作液体。
本文内容仅供参考,不构成任何专业建议。使用本文提供的信息时,请自行判断并承担相应风险。



