液冷驱动其他局部冷却
液冷在冷却 GPU 等高功耗芯片方面效果显著,但也给附近其他原本受益于 GPU 散热气流的芯片带来了热问题。随着气流消失,印刷电路板(PCB)上剩余热量的散逸正成为一项挑战。
冷却能够保证器件在规格范围内运行,并提升电路板和器件的可靠性。西门子数字工业软件公司的创新路线图经理罗宾・博恩诺夫表示:“温度始终是可靠性的首要指标。它本身不会导致失效,但会引发后续的热机械现象。器件发热会产生形变,形变过大就会断裂,进而导致 C4 凸点(或其他焊点)开裂,整个电路失效。”
气流可以覆盖电路板的每个部分,浸没式冷却也是如此。更常见的做法是,有针对性地利用液冷为高热芯片散热。无法采用液冷的芯片可能需要额外的被动或主动冷却措施,这催生了微冷却的概念 —— 冷却解决方案针对有限空间,仅对一个或少数几个器件进行冷却。

图 1:电路板的热仿真图显示强制气流来自右上方。若改为液冷,蓝色和红色芯片的温度可能降低,但中间未采用液冷的芯片可能变为红色。
在无气流的情况下,必须对电路板上所有器件进行分析,以识别新出现的热问题。针对这类情况,确实存在替代方案。新思科技电子热完整性高级产品经理杰夫・萨普表示:“在缺乏主动冷却的情况下,可以采用均热板、热管等技术。”
基础热核算
传统上,电路板作为一个整体进行冷却,通过充足的气流保证板上器件工作在规定温度范围内。确定气流量需要了解所有热源,以确保冷却效果足够。
萨普解释道:“要确定温度值,需要知道产热速率和散热速率,二者达到平衡时的温度即为工作温度。”
但电路板通常只有少数几个主要热源,其余器件数量众多。为便于讨论,我们可以(不严格地)将需要液冷的芯片称为高热芯片,接近热极限的称为温热芯片,远离过热风险的称为冷芯片。设计焦点通常集中在高热芯片,但在对整块电路板进行热性能仿真时,需要纳入所有器件(包括温热和冷芯片)的贡献。采用风冷时,所有器件都能受益。
如果冷却分析仅关注高热芯片,那么冷却方式可能对高热芯片足够,但对周围的温热器件可能不足。在无气流的情况下,温热芯片可能变成高热芯片。这是否意味着它们现在也必须采用液冷?或许是,但并非必然。
整板热交互
电路板上任意一点的温度,取决于各器件的产热和散热方式。产热通常取决于器件的工作负载,因此散热是实际可调节的手段 —— 降低工作负载是最后手段,会削弱电路板的功能价值。
相邻热源会影响散热。紧邻高热 GPU 的 HBM 堆叠,其自身散热难度会高于无 GPU 时的情况。对电路板进行整体分析时,必须考虑这些器件间的相互作用,以确定合适的气流方案。
新思科技产品营销总监马克・斯温嫩表示:“进行温度分析时,我们可以计算芯片的产热功率,但功率是速率,不是温度。该产热速率对应的实际温度取决于环境。这存在一个鸡生蛋、蛋生鸡的问题:芯片的功率取决于温度,而温度又取决于功率,因此需要多次迭代计算。”
关键问题在于,所有冷却方案是为特定电路板定制的,还是部分芯片在采购时已集成冷却方案。专为液冷设计的芯片,在制造过程中可能单独集成了冷却结构。冷板等技术可在电路板组装时安装,并针对特定电路板定制,但直接喷射式冷却需要无遮挡地接触硅裸片,无法在晶圆厂和封装厂之间的环节加装,否则会使硅片面临损坏或污染风险。
在这些情况下,冷却方案可能仅根据芯片自身的热特性安装,忽略了周围器件的影响。采购并安装此类器件的用户可以放心芯片会保持在规格范围内,但这与相邻器件无关。
其他冷却方案
电路板热分析可以识别未采用液冷但存在过热风险的器件。此时可采用的冷却技术并非只有全液冷。萨普指出:“在无强制气流的情况下,仍有许多技术可供使用。”
部分技术仍涉及液体,但采用自包含形式,例如均热板和热管。
均热板利用小体积内的对流,使液体接触芯片封装顶部。液体蒸发后上升至腔体顶部,与外部冷板接触,蒸汽冷却后变回液体。对流驱动液体和蒸汽循环,实现高效散热。
热管外观与液冷相似,也使用液体,但无需全液冷所需的复杂冷却基础设施,几乎是微型液冷方案。其核心思想是将芯片(尤其是拥挤区域、空间有限的芯片)的热量转移到其他位置进行更有效的散逸。热量驱动液体循环,并非永动机。
新思科技 SoC 工程高级工程师萨提亚・卡里马吉表示:“内部的冷却剂在蒸发器侧吸收热量后发生相变变成蒸汽,从蒸发器移动到冷凝器。在冷凝器处,散热片或风扇将蒸汽的热量带走,蒸汽冷凝后通过毛细作用返回封装。”
部分技术最初是为其他类型系统设计的。卡里马吉表示:“热管和均热板用于笔记本电脑、手机等薄型设备。” 但它们的应用范围可能会扩大。
部分场景可能不需要如此复杂的方案。散热片通常通过气流散热,但即使无气流,设计良好的散热片也能通过更大的散热面积提升冷却效果。
局部风扇
在电路板空间允许的情况下,部分工程师会在板上安装小型风扇以提供额外气流。这类风扇会占用一定空间,其位置对确保目标器件获得充足气流至关重要。如果将空气排出电路板外即可满足需求,该方案可行;但如果需要将空气进一步排出系统外,则需要恢复转换为液冷时拆除的风冷基础设施。
旋转风扇体积较大,小型版本虽可用于电路板,但无法适配智能眼镜等空间极度受限的系统,且噪音较大。
一种替代方案是在温热芯片顶部安装 MEMS(微机电系统)微型风扇。该器件有两个端口,一个进风,一个出风。安装在芯片封装上时,可通过隔离区在风扇和芯片之间留出气流空间;侧通风型号则无需隔离区,可直接安装在芯片上。

图 2:芯片顶部安装 MEMS 风扇的两种方式。上方方案中,隔离区为芯片下方留出空间,空气可横向甚至向上从顶部通风口排出;侧通风方案无需隔离区。
xMEMS 的该器件源于其扬声器业务。MEMS 扬声器利用压电效应,通过电压变化驱动振膜移动空气,而我们感知到的移动空气就是声音。xMEMS 营销与业务开发副总裁迈克・豪斯霍尔德表示:“我们将压电材料作为执行器,硅材料作为振膜。根据驱动 MEMS 的谐振频率和超声波调制方式,我们既可以产生音频,也可以产生气流。”
同一原理可用于制造恒速甚至变速风扇,无需扬声器的调制功能。配套的 ASIC 芯片驱动压电元件振动,使空气通过端口流动。空气可双向流动 —— 底部进、顶部出,或相反。例如,可正向流动用于冷却,反向流动用于清洁。
豪斯霍尔德表示:“系统处理器通过 I2C 指令在 ASIC 中设置气流方向,可实时动态调整气流方向和速率。气流由电压控制,电压越高,气流越大;电压越低,气流越小。”
比传统风扇更安静
该技术源于音频领域,其工作频率在千赫兹级别,通常远低于电路板上任何器件的频率,极高次谐波也不会干扰电气元件。风扇频率与芯片频率相差六个数量级以上,任何可察觉功率的谐波都无法产生干扰。
风扇的另一大痛点是噪音。人类可听范围在千赫兹级别,而该风扇工作频率超过 40 千赫兹,是人类最高可听频率的两倍,因此非常安静。
豪斯霍尔德表示:“3 厘米处无机械噪音,仅气流产生的噪音为 18 分贝 A 计权(dBA),完全不可闻。”(dBA 是根据人耳响应特性加权的分贝值,相比之下,轻声耳语约为 30dBA。)该公司还表示,其不受外部振动干扰。
可能需要额外措施确保气流到达目标位置。豪斯霍尔德表示:“以公司支持的 SSD(固态硬盘)为例,我们使用金属屏蔽罩 —— 类似射频的 EMI 屏蔽罩,也可以是塑料材质,材料无关紧要。我们将气流引导至屏蔽罩下方的所有芯片。通过风道或通道设计,可从系统外部或其他位置吸入冷空气。”
xMEMS 正研究用该技术冷却 HBM 堆叠,但无法在堆叠顶部加装器件,一种可能的方案是冷却侧面,这有助于解决堆叠中间芯片最难冷却的问题。
MEMS 冷却器可安装在芯片或电路板上,该公司甚至可将其设计为小芯片,集成于先进封装中。但要实现这一点,需要将金属盖子改为硅盖,且先进封装需设置进风口和出风口。
主动散热片
该公司还在研发所谓的主动散热片,将风扇安装在散热片顶部。大多数散热片的鳍片或引脚之间需要留出足够空间以保证正常气流,这涉及背压概念 —— 气流受到的阻力。传统风扇的背压低,但微型风扇直接向散热片顶部吹风,背压更高。这意味着散热片可采用更密集的引脚阵列,增加散热面积,提升散热效果。
豪斯霍尔德解释道:“我们将背压转化为优势,推动空气通过狭小空间。这是针对特定热点的定向冷却,而普通风扇是大范围吹风。”
该器件尺寸为 9×7 平方毫米,厚度 1 毫米,成本在 5 至 10 美元之间。最初设计用于智能手机和 AR 眼镜,这类应用可接受该价格,但消费类产品可能难以接受,尽管部分消费类产品的功耗正在升高。其在数据中心的首个应用是固态硬盘。
该方案仅适用于中等功耗的器件。豪斯霍尔德表示:“微冷却可对功耗 15 至 18 瓦的系统产生效果,具体取决于系统的热架构。”
原本无需冷却的芯片现在需要冷却
随着系统转向液冷,或即使无冷却系统发展到需要部分冷却的阶段,必须对整块电路板进行分析,识别高热、温热和冷芯片。
数据中心的高热芯片采用浸没式液冷。数据中心外几乎不存在液冷基础设施,因此在现有技术条件下,功耗约 20 瓦以内的高热芯片可通过微型风扇冷却。功耗超过该值且无液冷、气流不足时,可能需要采取措施降低产热。
原本无需额外冷却的温热芯片现在可能需要散热片、均热板、热管或局部风扇。冷芯片温度会升高,但仍应保持在设计范围内。
随着更多系统转向液冷且功耗不断提升,对于需要辅助冷却但无需全液冷的芯片,可能会出现更多解决方案。无论何时有可用的冷却方案,部署时都必须对整块电路板进行分析。
加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW
或用微信扫描左侧二维码