学术交流
动态信息

中科院微电子研究所薛海韵研究员团队:分立式液冷协同散热破解宽带CPO系统热串扰与高温难题

来源:   作者:  发布时间:2025年09月06日  点击量:

研究背景

人工智能与机器学习技术的快速发展对数据中心的数据交换速度与交换机带宽提出了极高要求。传统板载光模块因电互连距离长,导致信号完整性差、系统功耗高,难以满足需求。光电共封装(CPO)技术将光模块与交换芯片集成在同一基板上,不仅大幅缩短电互连距离,还显著降低功耗,因此成为极具价值的解决方案。然而,高集成度导致功率密度激增与热串扰加剧,使热管理成为制约高容量CPO可靠性的关键挑战之一。


文章简介

中国科学院微电子研究所薛海韵研究员团队针对51.2 Tbit/s CPO系统的独特架构,详细分析了其散热需求,设计了一套液冷散热方案,基于Navier-Stokes方程进行仿真与优化,并搭建实验平台进行验证。仿真结果表明,在4 L/min流速下,交换芯片结温为97.3°C,光模块最高结温为31.3°C,模块间温差控制在1.2°C至2.4°C之间。实验结果显示温度仿真误差小于4%,压力变化趋势与仿真一致,验证了所设计热沉可满足51.2 Tbit/s CPO系统的散热需求。本研究为液冷技术在CPO中的应用提供了理论与实践依据,对波分复用系统与微环器件应用中的光电子集成技术具有重要支持作用。相关工作近期以Simulation and experimental investigation of liquid-cooling thermal management for high-bandwidth co-packaged optics 为题发表在Frontiers of Optoelectronics期刊上。


图文简介

1.针对CPO高热流密度与热串扰挑战提出分立式液冷散热方案

为解决交换芯片(750 W,热通量1.79 W/mm2)与光模块(64 W,热通量0.2 W/mm2)的散热差异及热串扰问题,设计了两套独立热沉:交换芯片采用歧管微通道热沉(Manifold Microchannel Heat Sink),光模块采用并联微通道热沉,确保冷却液同温流入各模块,实现温度均匀性。图1展示了两类热沉结构;图2b显示了冷却液先经交换芯片热沉再流入光模块热沉的流道布局。

图1 散热结构。a 开关芯片的热沉。b 光模块的热沉


图2 a 组件示意图,b 流道布局示意图


2.优化交换芯片和光模块热沉提升散热效率

歧管设计对交换芯片热沉的散热效果具有显著影响。由图 3e 可知,“一进一出” 式歧管布局的散热效率最佳,但与其他设计相比,其产生的压降也明显更高。在散热效率方面,“一进两出” 式歧管仅次于 “一进一出” 式歧管,且其压降仅略有增加。为进一步提升传热性能,研究人员还设计了一种局部波浪形微通道(图4e):仅在芯片中心的热点区域采用波浪形结构,其余区域仍使用直型通道。该结构不仅具备更优异的散热性能,同时能将压降增幅控制在可接受范围内。

图3 开关芯片热沉结构参数优化。a 芯片最高结温随液冷板厚度的变化;b 芯片最高结温及压降随微通道宽度的变化;c 芯片最高结温及压降随微通道深度的变化;d 芯片最高结温及压降随歧管通道深度的变化;e 不同歧管布局对结温及压降的影响:(i) 四进五出、(ii) 三进四出、(iii) 二进四出、(iv) 一进二出、(v) 一进一出、(vi) 阵列式


图4 不同微通道形状的开关芯片热沉的散热性能。a 传统直型微通道。b 带针肋的微通道。c 带凹坑结构的微通道。d 波浪形微通道。e 局部波浪形微通道


通过优化微通道宽度、深度、歧管深度等参数,可在保证制造可行性的前提下使得光模块热沉的散热效率最大化。由于光模块热沉采用了更短的微通道且微通道数量更多,使得每条通道内的流速更小,因此,波浪形微通道展现出更为优异的散热性能,同时压降增幅仍处于可接受范围内。

最终的仿真结果显示优化后交换芯片结温从121°C降至97.3°C,光模块最高结温从33°C降至31.3°C。

图5 光模块热沉结构参数优化。a 光模块最高结温及温差随冷板厚度的变化;b 光模块最高结温、温差及压降随微通道宽度的变化;c 光模块最高结温、温差及压降随微通道深度的变化;d 光模块最高结温、温差及压降随集流道深度的变化;e 不同形状微通道对光模块最高结温、温差及压降的影响


3.高效温度的控制的实验验证

本研究通过将热测试芯片倒装键合至测试板的方式模拟CPO系统。热沉采用直接金属激光烧结(DMLS)技术制造。图 6 为实验平台示意图。在进、出口处连接差压计,用于测量系统内的压降;将热电偶探头插入芯片底部中心位置,以监测芯片的结温;进、出口处同样设置热电偶,用于监测流体温度变化;在进水软管处安装流量计,以监测压降变化。所搭建的实验平台如图 7 所示。实验结果(图8)表明,当CPO带宽达到51.2 Tbit/s时,4 L/min流速下开关芯片的最高温度为98.3°C,光模块的最高温度为35.1°C,均达到了英特尔设定的最高温度目标(开关芯片结温低于105°C,光模块结温低于100°C——J. Lightwave Technol., 2022, 40(2), 379–392);光模块最大温差为1.5°C,满足DWDM系统对波长稳定性的要求(Δλ < 0.1 nm/°C)。

图6 实验平台示意图


图7 a 测试板;b 热沉安装;c 搭建的实验平台


图 8 a 不同带宽下 CPO 系统中开关芯片的最高结温;b 不同带宽下 CPO 系统中光模块的最高温度及温差


总结与展望

本研究成功设计并验证了一种适用于51.2 Tbit/s CPO系统的液冷散热方案,通过分立式热沉设计、局部波浪形微通道优化与多参数协同调控,实现了高热流芯片的高效冷却与光模块的均匀温控。实验与仿真高度吻合,证明了该方案的实际可行性。未来,液冷散热技术有望成为CPO及下一代数据中心服务器集群热管理的核心技术,为高速光通信网络的高性能与高可靠性提供关键支撑。