AI“探电”:Power shelf向Power rack升级

本周英伟达召开GTC大会其中Delta研发主管Ralf Pieper进行了题为《Grid-to-Chip Power Solutions for Giga-Wattscale AI Data Centers》[1]的演讲。

摘要

从Power shelf到Power rack,电源厂商重要性大幅升级。本次GTC大会麦格米特携带Power side car的方案进行参展,同时台达也在演讲中提出下一代Rubin方案将应用Power rack。Power rack集成了Power shelf、BBU shelf、Super cap shelf、PDU等产品,同时IT rack柜需800V到50V转化进一步增加了电源使用,因此我们认为电源厂商参与的价值量大幅增加。同时这也意味着AI电源行业竞争壁垒增厚,需具备多产品的技术能力。

800V高压应用使得熔断器等电路保护器件用量增加。从Delta展示来看,其在Power rack、HVDC power shelf、High voltage DCDC等多处都有应用。我们认为电源单独成柜导致需要高压方案降低电流以减少线损,而高压方案则进一步带动熔断器等器件用量增加以实现灭弧等电路保护措施。

SST是下一代数据中心的供电技术路线。 SST方案能够直接将高至10~34.5KV的电流转化为800V的直流电输出,整体SST方案采用模块化设计,这也意味着电压在模块与模块之间均等分布。因此在不同的国家、地区,可以使用SST方案轻松地在不同的电压等级之间进行切换。

超级电容显著降低供电的波动性。AI数据中心不断进行训练任务并进行高速运算,当开始训练任务时负载会迅速上升至较高功率,而当训练任务结束后又会下降至较低水平。超级电容利用快速充放电的特性实现降低供电波动性,根据台达电数据其超级电容能够将供电波动性从73%降至6%。

我们认为Power shelf到Power rack的技术架构变化中最受益的仍为服务器电源厂商,其一在于其价值量增加,其二在于其竞争壁垒增厚。从单纯的Power shelf到涵盖输入/输出PDU、BBU shelf、Super cap shelf等的Power rack这意味着价值量的大幅提升,此外由于单独成柜也要求Power rack和IT rack内各自有一套power shelf分别完成800Vdc和50Vdc的输出。

风险

AI资本开支不及预期,技术路线变动,行业竞争加剧

电源架构从Power shelf向Power rack升级

对于数据中心的输配电方案来讲,本次GTC大会最大的增量在于确立Power rack为下一代技术方案路线。对于GB200/GB300而言,主要采用NVL72/36的机架形式,其将power shelf、compute node、NVlink switch、CDU等都整合至同一个长方体式的机柜内部,但随着芯片本身的迭代升级其自身功率不断升级对于供电要求也越来越高。但我们看到整个机架中75%以上的体积被Compute node所占据,没有额外的空间为增量电源以及电源配件BBU、超级电容提供空间。因此将Powershelf、BBU shelf、Super cap shelf等移出机柜组建为一套Power rack形成新的供电单元以解决当前数据中心输配电所面临的问题。

图表1:当前电源架构面临的问题

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

Power rack方案带来输配电架构更高的集成度和全新的产品架构。Power rack将power shelf、BBU shelf、Super cap shelf、PDU等集成一体化,形成高度整合的电源旁柜方案。根据麦格米特在GTC大会中展出的Side car方案来看,其输入为384V~528V的交流电输出为800V的直流电,机柜尺寸为600mm(W)*1068mm(D)*2236mm(H)。具体而言,其上端集成了PDU方案,左侧为Powershelf右侧为BBU shelf和Super cap shelf等。

图表2:麦格米特Power rack的具体方案

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,麦格米特,中金公司研究部

► PDU:根据Delta的方案,PDU分为输入PDU和输出PDU。其中输入PDU内含L1-L3三路input busbar以及多个MCB短路保护器、熔断器等;而将BBU、power shelf、Super cap shelf等收集的800V电压回流至顶部的输出PDU后则需进一步完成Power rack到IT rack之间的连接。输出PDU内含继电器、熔断器等保护器件,其中相对昂贵的线缆可以大概承受68安培的电流,对应电压为800V则其每根线缆能够支撑54KW的功率。

图表3:Side car的PDU方案

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

► Powershelf:根据Delta的方案,Powershelf同样分为Power rack侧和IT rack侧的两类产品。1)Power rack侧的power shelf:其将PDU侧480Vac转化为800Vdc输出,其内部仍然是采用了经典的Vienna PFC+LLC拓扑结构,但由于电压较高内部损耗更低,整体效率可以达到98%+的水平。从具体的结构来看,台达的方案为一套Power rack侧的power shelf由两组27.5kw的PSU组成,综合功率共计55kw。2)IT rack侧的power shelf[2]:其将前端的800V直流电转化为50V的直流电供给至后端的DCDC模组。从具体结构来看,单层由6组15kw的PSU组成,合计约90kw,整体效率高达98.5%以上。

图表4:Power rack 侧的Powershelf拓扑结构

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

图表5:Side car的Powershelf方案

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

英伟达预计2026-2027年将逐步开始应用Rubin,同步Power rack方案也将逐步落地。Rubin采用正交式的机架和Kyber方案,其具体结构为左右两个分立的机柜,左侧为IT-rack右侧为Power rack,根据英伟达估计2026-2027年将逐步应用Rubin,而2027-2028年逐步应用Feyman,而rubin方案的应用也代表着Power rack的方案将加速到来。

图表6:英伟达Kyber方案的架构(左)以及Rubin方案的时间线

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,中金公司研究部

电源架构持续升级,SST是面向未来的技术路线

谷歌曾在《+/-400Vdc Rack for AI/ML Applications》一文中给出了未来主流的数据中心供电架构演进的路线图,当前来看我们主要处于Architecture1、2,而Architecture3则代表着side car的方案,未来有望逐步进入SST方案下的输配电路线。

图表7:谷歌数据中心电源架构的Road map

AI“探电”:Power shelf向Power rack升级

资料来源:《+/-400Vdc Rack for AI/ML Applications》(Google,2024.10),中金公司研究部

从Architecture1、2到3、4最大的边际变化在于电压等级。从Architecture3开始,power shelf与服务器分离,彼此之间依靠线束进行连接。而对比来看,此前的Power shelf的输入为240V/380V 交流电,输出为50V直流电,而Power rack的存在意味着如果仍然以50V的电压等级进行输出则会在Power rack和IT rack之间的传输中电流较大,而线损往往是跟电流的平方成正比,因此需要大幅升高电压至800V以降低线损。

台达认为未来将进入800V SST的技术路线。SST方案能够直接将高至10~34.5KV的电流转化为800V的直流电输出,整体SST方案采用模块化设计,这也意味着电压在模块与模块之间均等分布。因此在不同的国家、地区,可以使用SST方案轻松地在不同的电压等级之间进行切换。

图表8:数据中心供电架构的逐步演进

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

图表9:SST架构

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

在IT rack侧的800V到50V电压转化也可以通过Tray level的形式进行降压。在Tray level上可以通过PDB(power distribute board)来实现板基级别的电压转化,直接将800V电压转化至50V或者12V的电压,由于电压跨度较高因此也对安全性、可靠性等提出了更高的要求,此外整体的功率密度也上升至500W/inch^3。

图表10:Tray level的800V到50V转化

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

超级电容的应用有望

大幅提升GPU的动态负载能力

数据中心训练任务的动态负载特性主要表现为周期性、大幅度、瞬时性冲击等。AI数据中心的负载运行特点是不断进行训练任务进行高速运算,当开始训练任务时负载会迅速上升至较高功率,而当一次训练任务结束后又会下降至较低水平,而这样的波动性也对数据中心的供电构成了较大的挑战。

图表11:AI算力集群负载动态功耗曲线图

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

不同的超容方案特点有所差异。对比来看,EDLC方案的循环寿命较长可以达到1900万次,而LiC多为100万次左右,而EDLC的Hold up时长相对较短仅为1-2秒,而LiC约为10-15s,此外功率密度上LiC约为40-50Wh/Kg也高于EDLC的5-7Wh/Kg。

图表12:不同类型超级电容对比(左),台达的超级电容方案(右)

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

超级电容的具体工作过程分为四个阶段,其能够显著降低供电的波动性。具体来看,超级电容的工况依次经历50ms左右的EDPC+EDPP、20-30ms的EDPC、20-30ms的Idle以及最后的EPDC,以阶段1为例,在超过额定值的范围超级电容进行放电,在低于额定值的范围超级电容进行充电。从结果来看,超级电容能够将供电的波动性从73%压降至6%。

图表13:超级电容工作原理

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

图表14:超级电容效果对比

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

本文摘自中金公司2025年3月24日已经发布的《AI“探电”(六):GTC大会观察— Power shelf向Power rack升级》

江鹏 分析员 SAC 执证编号:S0080523080006

曲昊源 分析员 SAC 执证编号:S0080523060004 SFC CE Ref:BSW232

王颖东 分析员 SAC 执证编号:S0080522090002

主题测试文章,只做测试使用。发布者:北方经济网,转转请注明出处:https://www.hujinzicha.net/10594.html

(0)
北方经济网的头像北方经济网
上一篇 2025年3月26日 上午11:05
下一篇 2025年3月26日 上午11:05

相关推荐

  • 680亿,一代“鞋王”卖身了

    消费行业再现一笔巨额收购。 近日,美国鞋业巨头斯凯奇宣布,3G资本将以每股63美元的现金价格收购公司全部已发行股本,交易价格约为94亿美元(约合人民币680亿元),预计将于今年三季度完成交易。 斯凯奇成立于1992年,主打运动休闲且平价,因此也被称为“鞋中老头乐”。1999年,公司成功在纽交所上市。去年,斯凯奇全球销售额高达89.7亿美元,是仅次于耐克和阿迪…

    商业 2025年5月13日
    4800
  • 世界,您好!

    欢迎使用 WordPress。这是您的第一篇文章。编辑或删除它,然后开始写作吧!

    商业 2025年3月14日
    41910
  • 车位为什么会越来越难卖

    翻出了一些以前写的文字 好像现在来看又别有一番滋味 围绕上海新房,我们也写了很多选题 比如像每年的供应量、积分数据以及“千人摇”红盘都是谁在买,还有连年上涨的物业费 但其实,一直在涨价的除了新房均价和物业费 还有一样不可忽视的,就是水涨船高的车位费 我选了内环内、内中环和外环外三个典型板块 可以看到这几年新房标准车位的价格都有不同程度的上涨 数据整理自网络,…

    2025年5月30日
    4100
  • 谁来操刀金字火腿?

    如果顺利的话,过不了多久,“火腿第一股”金字火腿,又将迎来新一任实控人。 这位准实控人名叫郑庆昇,虽然在资本市场籍籍无名,但来头不小。他是福建莆田知名企业家,旗下的产业涉及房地产、教育和豪华汽车销售,已在上海经销英国豪华汽车品牌阿斯顿·马丁15年。 此番,郑庆昇跨界入主金字火腿,如何推动这家“不断跨界”的上市公司持续向前,还有待观察。 再次易主 几乎没有任何…

    商业 2025年5月8日
    5300
  • 4月PMI:政策的窗口正在打开

    4月PMI作为关税冲击下的第一份宏观数据,表明前期“抢出口”已告一段落。外部冲击的影响开始显现,对特定行业和企业的风险不容低估。 这种影响直观地体现在4月PMI回落的幅度上——不论是制造业PMI整体,还是PMI新出口订单指数,其单月下滑幅度均远超2018年。 如何更全面地评估4月PMI数据?我们尝试从五个维度进行盘点: 维度一(直接影响):进出口订单的“急凉…

    2025年4月30日
    7300

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信