液冷技术崛起:英伟达新芯片引领AI服务器散热变革 -- 知识铺
作为算力的重要载体,AI服务器功率不断提升,传统风冷散热已经触及散热极限,并不能够满足AI服务器发展对散热的需求;另外,国家对数据中心PUE建设要求也越来越高,液冷技术成为替代风冷的最优选择,将进入快速发展阶段。
3月19日,在英伟达2024 GTC大会上,英伟达CEO黄仁勋发布了基于Blackwell架构的B200以及超级芯片GB200,并再次引爆AI市场。值得一提的是,英伟达宣称新芯片的算力能够达到20 PetaFLOPS,但这一性能指标是基于使用新推出的FP4精度,并采用液冷散热方式下测试得出的。因此,想要发挥GB200的真正计算能力,液冷技术是必不可少的条件。
对此,国内多家研究机构表示,英伟达的选择在业内具有风向标意义,这次发布会将成为液冷发展的重要推动力,液冷技术将加速替代风冷成为市场主流。
液冷将成为主流
AI行业快速发展,GPU替代CPU成为未来数据中心建设的主要方向。不可否认,前者在处理高密度数据方面优于后者,但其缺陷也显而易见,即GPU功耗显著高于CPU,且呈现快速提升的态势。
据开源证券研报,在后摩尔时代下,芯片制程技术发展趋缓,计算芯片多以提高核心数量的方式提高算力,这导致CPU、GPU的功耗不断攀升。具体而言,从2017年Intel第一代铂金至强处理器发布到2023年年底第五代处理器问世,芯片核心数量从早期的24颗提升至最多64颗,TDP从也150W提升至最高385W。
GPU TDP的提升更为明显,最早应用于人工智能计算的V100 Nvlink的TDP为300W,英伟达最新发布的GB200 TDP已经超过1000W,这已经超过风冷散热的上限800W。相比之下,液冷则凭借其优秀的散热能力满足了高功耗芯片的散热需求。
需要指出的是,不仅是单点散热,机柜整体散热方面也同样接近风冷散热极限。根据Uptime Institute发布的《2022年全球数据中心调查报告》,AI的高速发展导致数据中心机架功率提升,以英伟达DGX A100服务器为例,其额定功率为4KW,单机最大功率为6.5KW,一个标准的42U高度的机柜大约可以放置5个5U高度的AI服务器,依次计算,单机柜总功率超过20KW,而采用传统风冷散热模式通常可以解决12KW以内的机柜制冷,无法满足AI服务器机柜的散热需求。
除了芯片功率的提升,国内政策也将推动液冷对风冷技术的替代。据中国通信院数据,2022年,中国数据中心平均PUE为1.52。而且,据数据中心绿色能源技术联盟统计,2021年,全国数据中心平均PUE为1.49,不足5成的数据中心PUE在1.40以下,数据中心PUE处于较高水平。
在“双碳”的宏观形势下,国家政策对数据中心PUE建设的要求越来越高,并先后出台了一系列政策。例如,2021年11月,国家发改委等部门颁布《贯彻落实碳达峰中和目标要求推动数据中心和5G等新型基础设施绿色高质量发展实施方案》,要求到2025年新建大型、超大型数据中心的PUE降到1.30以下,国家枢纽节点PUE进一步降低到1.25以下。
根据赛迪股份统计,数据中心制冷耗电占比约为43%,仅次于IT设备自身能耗,液冷技术相较于传统风冷散热,可取代大部分空调系统、风扇等高耗能设备,从而实现节能20%-30%。此外,除了制冷系统自身能耗降低外,采用液冷散热技术还有利于进一步降低芯片温度,而芯片温度降低则可带来更高的可靠性和更低的能耗,形成一个正向循环。
不可否认,相比于传统风冷,液冷的前期投入略高,但值得一提的是,液冷服务器运营商可以通过降低运行成本回收增量初始投资,以规模为10MW的液冷数据中心为例,预计2.2年可以回收因采用液冷技术而增加的基础设备投资。
另外,根据赛迪顾问发布的《2023中国液冷应用市场研究报告》,2022年,液冷数据中心1KW的建设散热成本已接近6500元,同比下降54.20%,预计2023年有望降至5000元左右,与传统风冷的建设成本基本持平。
市场空间与产业链
目前,市场主要的液冷技术包括冷板式、沉浸式以及喷淋式液冷,与后两者相比,冷板式发展较早,生态更完善,且兼具改造成本低与周期短等优点,但其散热能力略逊于沉浸式液冷。因此,冷板式液冷可作为传统风冷的平滑过渡,以便未来向沉浸式液冷转变。
根据赛迪数据,中国液冷数据中心市场规模保守估计由2019年的260.90亿元增至2025年的1283.20亿元,其中冷板式数据中心市场规模保守估计超过750亿元,年均复合增长率为22%;沉浸式液冷数据中心市场规模保守估计可超过500亿元,年均复合增长率为46%。而且,根据《电信运营商液冷技术白皮书》,预计到2025年,国内三大运营商50%以上的数据中心项目将采用液冷技术。
产业链方面,液冷产业链上游主要为零部件及液冷设备,包括快速接头、分级液器、冷却液等;中游主要为液冷服务器和液冷交换机等IT厂商;下游则是算力使用者和第三方IDC服务商。
国内上游厂商主要有英维克、飞荣达、曙光数创、申菱环境等。其中,英维克是老牌的精密温控节能解决方案和产品提供商,早在2022年,公司就与Intel等20家合作伙伴联合发布《绿色数据中心创新实践:冷板液冷系统设计参考》白皮书。而且,2023年11月,公司还发布XSpace微模块液冷方案,该方案可实现全年北方区域DPUE低于1.1,南方区域DPUE低于1.15。
更为重要的是,2022-2023年,英维克以第三名中标中国移动2023年冷冻水型机房专用空调产品集采,以第二名中标中国电信2023年冷冻水型机房专用空调集采,并连续中标东南亚大型数据中心液冷项目以及山西某数据中心间接蒸发冷却设备项目等。
随着这些重大项目陆续交付,英维克的业绩也明显增长。2023年前三季度,英维克的收入为20.72亿元,同比增长39.51%;归属母公司股东净利润为2.10亿元,同比增长79.91%,利润增速创近五年新高。
在服务器散热领域,飞荣达也是一家具有代表性的公司,其为客户提供散热及电磁屏蔽相关解决方案及产品,并针对服务器散热需求,开发了单相冷液模组、两相液冷模组及特种散热器等产品。
2023年上半年,飞荣达数据中心、服务器领域的客户包括华为、中兴、浪潮、新华三、超聚合等企业,公司热管理材料及器件合计收入为7.04亿元,占当期总收入的比重为49.26%。
液冷产业链中游代表厂商主要有浪潮信息、新华三、中科曙光等,液冷技术壁垒并不高,其难点在于对整服务器进行调整,因此服务器厂商在“风冷转液冷”过程中具有先天优势。
据IDC、Gartner发布的数据,2022年,浪潮信息在人工智能服务器市场占有率连续3年为全球第一,并连续六年保持中国第一。另外,2023年第一季度,浪潮信息服务器市场份额在中国市场同样保持第一。
液冷业务方面,浪潮信息建立了全亚洲最大的液冷数据中心研发生产基地,具有强大的液冷数据中心交付能力。值得一提的是,公司与京东云联合开发的“天枢”液冷机柜服务器,可以实现散热效率提升50%、能耗降低40%以上,并已经在京东云数据中心实现规模化部署。
而且,浪潮信息最新的全液冷机柜也实现了100%全液冷运行,实现了真正意义的“去空调化”,在提高算力的同时,年平均PUE可降至1.10以下,单机柜每年可节省电费21万元,广泛适用于新建液冷数据中心和老旧机房液冷改造。
作为市场份额略低的新华三,其在液冷领域也早有布局,并将液冷技术全面融入到全新的UniServer G6系列服务器中。而且,公司提供液冷数据中心全生命周期端到端的服务,以智能温控最大程度上减少制冷、散热关键环节的能耗,可让数据中心的PUE降至1.1以下。
在Gartner发布的全球服务器市场指南《Market Guide for Servers》中,新华三凭借在多元算力、液冷技术等方面的能力优势,成功入围Gartner全球服务器代表性厂商推荐名录。
- 原文作者:知识铺
- 原文链接:https://index.zshipu.com/stock/post/20240326/%E6%B6%B2%E5%86%B7%E6%8A%80%E6%9C%AF%E5%B4%9B%E8%B5%B7%E8%8B%B1%E4%BC%9F%E8%BE%BE%E6%96%B0%E8%8A%AF%E7%89%87%E5%BC%95%E9%A2%86AI%E6%9C%8D%E5%8A%A1%E5%99%A8%E6%95%A3%E7%83%AD%E5%8F%98%E9%9D%A9--%E7%9F%A5%E8%AF%86%E9%93%BA/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。
- 免责声明:本页面内容均来源于站内编辑发布,部分信息来源互联网,并不意味着本站赞同其观点或者证实其内容的真实性,如涉及版权等问题,请立即联系客服进行更改或删除,保证您的合法权益。转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。也可以邮件至 sblig@126.com