AI“探电”:Power shelf向Power rack升级

本周英伟达召开GTC大会其中Delta研发主管Ralf Pieper进行了题为《Grid-to-Chip Power Solutions for Giga-Wattscale AI Data Centers》[1]的演讲。

摘要

从Power shelf到Power rack,电源厂商重要性大幅升级。本次GTC大会麦格米特携带Power side car的方案进行参展,同时台达也在演讲中提出下一代Rubin方案将应用Power rack。Power rack集成了Power shelf、BBU shelf、Super cap shelf、PDU等产品,同时IT rack柜需800V到50V转化进一步增加了电源使用,因此我们认为电源厂商参与的价值量大幅增加。同时这也意味着AI电源行业竞争壁垒增厚,需具备多产品的技术能力。

800V高压应用使得熔断器等电路保护器件用量增加。从Delta展示来看,其在Power rack、HVDC power shelf、High voltage DCDC等多处都有应用。我们认为电源单独成柜导致需要高压方案降低电流以减少线损,而高压方案则进一步带动熔断器等器件用量增加以实现灭弧等电路保护措施。

SST是下一代数据中心的供电技术路线。 SST方案能够直接将高至10~34.5KV的电流转化为800V的直流电输出,整体SST方案采用模块化设计,这也意味着电压在模块与模块之间均等分布。因此在不同的国家、地区,可以使用SST方案轻松地在不同的电压等级之间进行切换。

超级电容显著降低供电的波动性。AI数据中心不断进行训练任务并进行高速运算,当开始训练任务时负载会迅速上升至较高功率,而当训练任务结束后又会下降至较低水平。超级电容利用快速充放电的特性实现降低供电波动性,根据台达电数据其超级电容能够将供电波动性从73%降至6%。

我们认为Power shelf到Power rack的技术架构变化中最受益的仍为服务器电源厂商,其一在于其价值量增加,其二在于其竞争壁垒增厚。从单纯的Power shelf到涵盖输入/输出PDU、BBU shelf、Super cap shelf等的Power rack这意味着价值量的大幅提升,此外由于单独成柜也要求Power rack和IT rack内各自有一套power shelf分别完成800Vdc和50Vdc的输出。

风险

AI资本开支不及预期,技术路线变动,行业竞争加剧

电源架构从Power shelf向Power rack升级

对于数据中心的输配电方案来讲,本次GTC大会最大的增量在于确立Power rack为下一代技术方案路线。对于GB200/GB300而言,主要采用NVL72/36的机架形式,其将power shelf、compute node、NVlink switch、CDU等都整合至同一个长方体式的机柜内部,但随着芯片本身的迭代升级其自身功率不断升级对于供电要求也越来越高。但我们看到整个机架中75%以上的体积被Compute node所占据,没有额外的空间为增量电源以及电源配件BBU、超级电容提供空间。因此将Powershelf、BBU shelf、Super cap shelf等移出机柜组建为一套Power rack形成新的供电单元以解决当前数据中心输配电所面临的问题。

图表1:当前电源架构面临的问题

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

Power rack方案带来输配电架构更高的集成度和全新的产品架构。Power rack将power shelf、BBU shelf、Super cap shelf、PDU等集成一体化,形成高度整合的电源旁柜方案。根据麦格米特在GTC大会中展出的Side car方案来看,其输入为384V~528V的交流电输出为800V的直流电,机柜尺寸为600mm(W)*1068mm(D)*2236mm(H)。具体而言,其上端集成了PDU方案,左侧为Powershelf右侧为BBU shelf和Super cap shelf等。

图表2:麦格米特Power rack的具体方案

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,麦格米特,中金公司研究部

► PDU:根据Delta的方案,PDU分为输入PDU和输出PDU。其中输入PDU内含L1-L3三路input busbar以及多个MCB短路保护器、熔断器等;而将BBU、power shelf、Super cap shelf等收集的800V电压回流至顶部的输出PDU后则需进一步完成Power rack到IT rack之间的连接。输出PDU内含继电器、熔断器等保护器件,其中相对昂贵的线缆可以大概承受68安培的电流,对应电压为800V则其每根线缆能够支撑54KW的功率。

图表3:Side car的PDU方案

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

► Powershelf:根据Delta的方案,Powershelf同样分为Power rack侧和IT rack侧的两类产品。1)Power rack侧的power shelf:其将PDU侧480Vac转化为800Vdc输出,其内部仍然是采用了经典的Vienna PFC+LLC拓扑结构,但由于电压较高内部损耗更低,整体效率可以达到98%+的水平。从具体的结构来看,台达的方案为一套Power rack侧的power shelf由两组27.5kw的PSU组成,综合功率共计55kw。2)IT rack侧的power shelf[2]:其将前端的800V直流电转化为50V的直流电供给至后端的DCDC模组。从具体结构来看,单层由6组15kw的PSU组成,合计约90kw,整体效率高达98.5%以上。

图表4:Power rack 侧的Powershelf拓扑结构

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

图表5:Side car的Powershelf方案

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

英伟达预计2026-2027年将逐步开始应用Rubin,同步Power rack方案也将逐步落地。Rubin采用正交式的机架和Kyber方案,其具体结构为左右两个分立的机柜,左侧为IT-rack右侧为Power rack,根据英伟达估计2026-2027年将逐步应用Rubin,而2027-2028年逐步应用Feyman,而rubin方案的应用也代表着Power rack的方案将加速到来。

图表6:英伟达Kyber方案的架构(左)以及Rubin方案的时间线

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,中金公司研究部

电源架构持续升级,SST是面向未来的技术路线

谷歌曾在《+/-400Vdc Rack for AI/ML Applications》一文中给出了未来主流的数据中心供电架构演进的路线图,当前来看我们主要处于Architecture1、2,而Architecture3则代表着side car的方案,未来有望逐步进入SST方案下的输配电路线。

图表7:谷歌数据中心电源架构的Road map

AI“探电”:Power shelf向Power rack升级

资料来源:《+/-400Vdc Rack for AI/ML Applications》(Google,2024.10),中金公司研究部

从Architecture1、2到3、4最大的边际变化在于电压等级。从Architecture3开始,power shelf与服务器分离,彼此之间依靠线束进行连接。而对比来看,此前的Power shelf的输入为240V/380V 交流电,输出为50V直流电,而Power rack的存在意味着如果仍然以50V的电压等级进行输出则会在Power rack和IT rack之间的传输中电流较大,而线损往往是跟电流的平方成正比,因此需要大幅升高电压至800V以降低线损。

台达认为未来将进入800V SST的技术路线。SST方案能够直接将高至10~34.5KV的电流转化为800V的直流电输出,整体SST方案采用模块化设计,这也意味着电压在模块与模块之间均等分布。因此在不同的国家、地区,可以使用SST方案轻松地在不同的电压等级之间进行切换。

图表8:数据中心供电架构的逐步演进

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

图表9:SST架构

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

在IT rack侧的800V到50V电压转化也可以通过Tray level的形式进行降压。在Tray level上可以通过PDB(power distribute board)来实现板基级别的电压转化,直接将800V电压转化至50V或者12V的电压,由于电压跨度较高因此也对安全性、可靠性等提出了更高的要求,此外整体的功率密度也上升至500W/inch^3。

图表10:Tray level的800V到50V转化

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

超级电容的应用有望

大幅提升GPU的动态负载能力

数据中心训练任务的动态负载特性主要表现为周期性、大幅度、瞬时性冲击等。AI数据中心的负载运行特点是不断进行训练任务进行高速运算,当开始训练任务时负载会迅速上升至较高功率,而当一次训练任务结束后又会下降至较低水平,而这样的波动性也对数据中心的供电构成了较大的挑战。

图表11:AI算力集群负载动态功耗曲线图

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

不同的超容方案特点有所差异。对比来看,EDLC方案的循环寿命较长可以达到1900万次,而LiC多为100万次左右,而EDLC的Hold up时长相对较短仅为1-2秒,而LiC约为10-15s,此外功率密度上LiC约为40-50Wh/Kg也高于EDLC的5-7Wh/Kg。

图表12:不同类型超级电容对比(左),台达的超级电容方案(右)

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

超级电容的具体工作过程分为四个阶段,其能够显著降低供电的波动性。具体来看,超级电容的工况依次经历50ms左右的EDPC+EDPP、20-30ms的EDPC、20-30ms的Idle以及最后的EPDC,以阶段1为例,在超过额定值的范围超级电容进行放电,在低于额定值的范围超级电容进行充电。从结果来看,超级电容能够将供电的波动性从73%压降至6%。

图表13:超级电容工作原理

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

图表14:超级电容效果对比

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

本文摘自中金公司2025年3月24日已经发布的《AI“探电”(六):GTC大会观察— Power shelf向Power rack升级》

江鹏 分析员 SAC 执证编号:S0080523080006

曲昊源 分析员 SAC 执证编号:S0080523060004 SFC CE Ref:BSW232

王颖东 分析员 SAC 执证编号:S0080522090002

主题测试文章,只做测试使用。发布者:北方经济网,转转请注明出处:https://www.hujinzicha.net/10594.html

(0)
北方经济网的头像北方经济网
上一篇 2025年3月26日 上午11:05
下一篇 2025年3月26日 上午11:05

相关推荐

  • 还嫌不够“胖”,永辉超市定增40亿补血

    永辉超市日前启动定增计划,拟募资近40亿元。其中,绝大部分将用于对旗下298家门店调改项目,以加速在明年完成旗下所有门店的调改工作。 不过,受战略转型以及门店调改的影响,公司业绩依然承压。继连续4年归母净利润亏损后,今年上半年预计再亏2.4亿元。 可以预见的是,随着门店调改的持续深入,永辉超市在短期内,仍将经受业绩和市场的双重考验。 定增40亿 为了早日像胖…

    商业 2025年8月1日
    2900
  • 暴跌82%,2025年A股首家“违法退”公司确定!

    *ST卓朗昨日公告,公司股票将于2025年2月7日进入退市整理期交易,预计最后交易日期为2025年2月27日。这也是蛇年首家进入退市整理期的公司。 退市整理期届满后5个交易日内,上交所将对公司股票予以摘牌,公司股票终止上市。 与此同时,*ST卓朗证券简称今日正式变更为退市卓朗。 今日开盘,退市卓朗股价一度大跌超82%,触发临时停牌,截止发稿股价暂报0.35元…

    2025年3月25日
    9000
  • 三季度大类资产如何交易?

    民生证券一直认为:作为一个慢变量,宏观应该是经济和金融市场中相对容易预测的部分。但在经历了近期的市场波动后,外界也许更加理解为什么会说:今年预测不到的事,远比民生证券自认为能预测的事要多。当“百年未有之大变局”下遇到了历史上数一数二“善变”的美国总统,全球宏观研究员和外贸企业突然成为了同一拨“被害者”。唯一能庆幸的是相比后者,至少不用安排自己的产品“海面两万…

    2025年6月25日
    10700
  • 特朗普的美国“梦”与现实

    核心观点 我们认为特朗普的不同政策追求或存在彼此间的结构性矛盾。1)矛盾一是减支的困难源于财政的结构性特征。2)矛盾二是关税和减税的因果悖论。尽管近期市场情绪回暖,但财报的积极表现并未完全打消美国市场对后续关税扰动可能的怀疑。往后看,二季度之后关税的谈判节奏及对美国经济的传导效果仍需重点关注。 摘要 导读:近期美国宏观经济数据仍延续“硬数据维持韧性,软数据开…

    商业 2025年5月9日
    8700
  • Take Two:曾取凌云志,再见拉满弓

    核心观点 从12年前的2011年公司发布的第一支《GTA5》开始,公司因产品驱动,到2018年期间处于快速增长期,其中《GTA5》为公司营收的快速增长做出了显著贡献,2023年,公司正式发布了《GTA6》的第一支预告,风靡市场。《GTA6》的发布将大幅增长公司营收,并成为公司股价上涨的关键增长点。在全球视角下,游戏市场正处于上升周期,不论从营收的角度亦或是玩…

    2025年4月11日
    6800

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信