AI“探电”:Power shelf向Power rack升级

本周英伟达召开GTC大会其中Delta研发主管Ralf Pieper进行了题为《Grid-to-Chip Power Solutions for Giga-Wattscale AI Data Centers》[1]的演讲。

摘要

从Power shelf到Power rack,电源厂商重要性大幅升级。本次GTC大会麦格米特携带Power side car的方案进行参展,同时台达也在演讲中提出下一代Rubin方案将应用Power rack。Power rack集成了Power shelf、BBU shelf、Super cap shelf、PDU等产品,同时IT rack柜需800V到50V转化进一步增加了电源使用,因此我们认为电源厂商参与的价值量大幅增加。同时这也意味着AI电源行业竞争壁垒增厚,需具备多产品的技术能力。

800V高压应用使得熔断器等电路保护器件用量增加。从Delta展示来看,其在Power rack、HVDC power shelf、High voltage DCDC等多处都有应用。我们认为电源单独成柜导致需要高压方案降低电流以减少线损,而高压方案则进一步带动熔断器等器件用量增加以实现灭弧等电路保护措施。

SST是下一代数据中心的供电技术路线。 SST方案能够直接将高至10~34.5KV的电流转化为800V的直流电输出,整体SST方案采用模块化设计,这也意味着电压在模块与模块之间均等分布。因此在不同的国家、地区,可以使用SST方案轻松地在不同的电压等级之间进行切换。

超级电容显著降低供电的波动性。AI数据中心不断进行训练任务并进行高速运算,当开始训练任务时负载会迅速上升至较高功率,而当训练任务结束后又会下降至较低水平。超级电容利用快速充放电的特性实现降低供电波动性,根据台达电数据其超级电容能够将供电波动性从73%降至6%。

我们认为Power shelf到Power rack的技术架构变化中最受益的仍为服务器电源厂商,其一在于其价值量增加,其二在于其竞争壁垒增厚。从单纯的Power shelf到涵盖输入/输出PDU、BBU shelf、Super cap shelf等的Power rack这意味着价值量的大幅提升,此外由于单独成柜也要求Power rack和IT rack内各自有一套power shelf分别完成800Vdc和50Vdc的输出。

风险

AI资本开支不及预期,技术路线变动,行业竞争加剧

电源架构从Power shelf向Power rack升级

对于数据中心的输配电方案来讲,本次GTC大会最大的增量在于确立Power rack为下一代技术方案路线。对于GB200/GB300而言,主要采用NVL72/36的机架形式,其将power shelf、compute node、NVlink switch、CDU等都整合至同一个长方体式的机柜内部,但随着芯片本身的迭代升级其自身功率不断升级对于供电要求也越来越高。但我们看到整个机架中75%以上的体积被Compute node所占据,没有额外的空间为增量电源以及电源配件BBU、超级电容提供空间。因此将Powershelf、BBU shelf、Super cap shelf等移出机柜组建为一套Power rack形成新的供电单元以解决当前数据中心输配电所面临的问题。

图表1:当前电源架构面临的问题

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

Power rack方案带来输配电架构更高的集成度和全新的产品架构。Power rack将power shelf、BBU shelf、Super cap shelf、PDU等集成一体化,形成高度整合的电源旁柜方案。根据麦格米特在GTC大会中展出的Side car方案来看,其输入为384V~528V的交流电输出为800V的直流电,机柜尺寸为600mm(W)*1068mm(D)*2236mm(H)。具体而言,其上端集成了PDU方案,左侧为Powershelf右侧为BBU shelf和Super cap shelf等。

图表2:麦格米特Power rack的具体方案

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,麦格米特,中金公司研究部

► PDU:根据Delta的方案,PDU分为输入PDU和输出PDU。其中输入PDU内含L1-L3三路input busbar以及多个MCB短路保护器、熔断器等;而将BBU、power shelf、Super cap shelf等收集的800V电压回流至顶部的输出PDU后则需进一步完成Power rack到IT rack之间的连接。输出PDU内含继电器、熔断器等保护器件,其中相对昂贵的线缆可以大概承受68安培的电流,对应电压为800V则其每根线缆能够支撑54KW的功率。

图表3:Side car的PDU方案

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

► Powershelf:根据Delta的方案,Powershelf同样分为Power rack侧和IT rack侧的两类产品。1)Power rack侧的power shelf:其将PDU侧480Vac转化为800Vdc输出,其内部仍然是采用了经典的Vienna PFC+LLC拓扑结构,但由于电压较高内部损耗更低,整体效率可以达到98%+的水平。从具体的结构来看,台达的方案为一套Power rack侧的power shelf由两组27.5kw的PSU组成,综合功率共计55kw。2)IT rack侧的power shelf[2]:其将前端的800V直流电转化为50V的直流电供给至后端的DCDC模组。从具体结构来看,单层由6组15kw的PSU组成,合计约90kw,整体效率高达98.5%以上。

图表4:Power rack 侧的Powershelf拓扑结构

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

图表5:Side car的Powershelf方案

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

英伟达预计2026-2027年将逐步开始应用Rubin,同步Power rack方案也将逐步落地。Rubin采用正交式的机架和Kyber方案,其具体结构为左右两个分立的机柜,左侧为IT-rack右侧为Power rack,根据英伟达估计2026-2027年将逐步应用Rubin,而2027-2028年逐步应用Feyman,而rubin方案的应用也代表着Power rack的方案将加速到来。

图表6:英伟达Kyber方案的架构(左)以及Rubin方案的时间线

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,中金公司研究部

电源架构持续升级,SST是面向未来的技术路线

谷歌曾在《+/-400Vdc Rack for AI/ML Applications》一文中给出了未来主流的数据中心供电架构演进的路线图,当前来看我们主要处于Architecture1、2,而Architecture3则代表着side car的方案,未来有望逐步进入SST方案下的输配电路线。

图表7:谷歌数据中心电源架构的Road map

AI“探电”:Power shelf向Power rack升级

资料来源:《+/-400Vdc Rack for AI/ML Applications》(Google,2024.10),中金公司研究部

从Architecture1、2到3、4最大的边际变化在于电压等级。从Architecture3开始,power shelf与服务器分离,彼此之间依靠线束进行连接。而对比来看,此前的Power shelf的输入为240V/380V 交流电,输出为50V直流电,而Power rack的存在意味着如果仍然以50V的电压等级进行输出则会在Power rack和IT rack之间的传输中电流较大,而线损往往是跟电流的平方成正比,因此需要大幅升高电压至800V以降低线损。

台达认为未来将进入800V SST的技术路线。SST方案能够直接将高至10~34.5KV的电流转化为800V的直流电输出,整体SST方案采用模块化设计,这也意味着电压在模块与模块之间均等分布。因此在不同的国家、地区,可以使用SST方案轻松地在不同的电压等级之间进行切换。

图表8:数据中心供电架构的逐步演进

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

图表9:SST架构

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

在IT rack侧的800V到50V电压转化也可以通过Tray level的形式进行降压。在Tray level上可以通过PDB(power distribute board)来实现板基级别的电压转化,直接将800V电压转化至50V或者12V的电压,由于电压跨度较高因此也对安全性、可靠性等提出了更高的要求,此外整体的功率密度也上升至500W/inch^3。

图表10:Tray level的800V到50V转化

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

超级电容的应用有望

大幅提升GPU的动态负载能力

数据中心训练任务的动态负载特性主要表现为周期性、大幅度、瞬时性冲击等。AI数据中心的负载运行特点是不断进行训练任务进行高速运算,当开始训练任务时负载会迅速上升至较高功率,而当一次训练任务结束后又会下降至较低水平,而这样的波动性也对数据中心的供电构成了较大的挑战。

图表11:AI算力集群负载动态功耗曲线图

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

不同的超容方案特点有所差异。对比来看,EDLC方案的循环寿命较长可以达到1900万次,而LiC多为100万次左右,而EDLC的Hold up时长相对较短仅为1-2秒,而LiC约为10-15s,此外功率密度上LiC约为40-50Wh/Kg也高于EDLC的5-7Wh/Kg。

图表12:不同类型超级电容对比(左),台达的超级电容方案(右)

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

超级电容的具体工作过程分为四个阶段,其能够显著降低供电的波动性。具体来看,超级电容的工况依次经历50ms左右的EDPC+EDPP、20-30ms的EDPC、20-30ms的Idle以及最后的EPDC,以阶段1为例,在超过额定值的范围超级电容进行放电,在低于额定值的范围超级电容进行充电。从结果来看,超级电容能够将供电的波动性从73%压降至6%。

图表13:超级电容工作原理

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

图表14:超级电容效果对比

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

本文摘自中金公司2025年3月24日已经发布的《AI“探电”(六):GTC大会观察— Power shelf向Power rack升级》

江鹏 分析员 SAC 执证编号:S0080523080006

曲昊源 分析员 SAC 执证编号:S0080523060004 SFC CE Ref:BSW232

王颖东 分析员 SAC 执证编号:S0080522090002

主题测试文章,只做测试使用。发布者:北方经济网,转转请注明出处:https://www.hujinzicha.net/10594.html

(0)
北方经济网的头像北方经济网
上一篇 2025年3月26日 上午11:05
下一篇 2025年3月26日 上午11:05

相关推荐

  • 辟谣不改资金追捧,信隆健康8连板!深交所盘后披露,谁在买?

    自3月4日以来,信隆健康(002105.SZ)在二级市场吸睛无数。 这只市值不足40亿元的”袖珍股”,在短短8个交易日内连续封板,累计涨幅超114%,区间换手率超113%。 今日(3月13日)早盘,公司虽紧急澄清”未涉足AI医疗及机器人业务”,但仍以缩量涨停收官,封单金额超1.6亿元,显示资金炒作热情不减。昨日…

    2025年3月25日
    2000
  • 大行注资落地,如何影响债市?

    核心观点 注资的动因是什么?截至2024年末,国有大行的资本充足率均满足监管要求,本轮注资更多是为了巩固银行的稳健经营能力,提升其支持实体经济的能力。以2024年末的核心一级资本充足率数据测算,本轮注资后,若保持核心一级资本充足率不变,则可对应增加加权风险资产4.6万亿元,假设这部分资金全部用于信贷投放,对应可支撑4.6-6.1万亿元的新增贷款,为后续潜在的…

    2025年4月8日
    2300
  • 早报 (02.22)| 3000亿解冻?曝俄罗斯妥协重建乌克兰;马斯克下一目标:审计美联储;万科再获大股东42亿借款支持

    特朗普称有机会达成俄乌和平协议,未计划5月9日访俄。 另据三位消息人士透露,俄罗斯可能同意使用冻结在欧洲的3000亿美元主权资产用于乌克兰重建,但将坚持将部分资金用于莫斯科军队控制的乌克兰五分之一的领土。 美国“政府效率部”领导人马斯克最新表示,他正在考虑对美联储进行审计。此前,他曾呼吁提高美联储的透明度,还曾炮轰美联储“人力过剩”。 全球知名加密货币交易所…

    2025年3月25日
    3200
  • “年中美债集中到期”的现实与误读

    近期市场存在“年中美债集中到期”的叙事。然而,从美国到期债务结构、财政操作和市场行为来看,这一叙事存在明显夸大。美债到期结构方面,今年年中确实存在一定的集中到期压力,但主要源于短债(T-Bills)。不过,T-Bills以高频滚动、“借新还旧”为常态,而且从“对等关税”发布后T-Bills的拍卖情况看,T-Bills需求依旧稳定。另外,我们观察到在特朗普2.…

    2025年4月29日
    900
  • 早报 (03.26)| 刚刚!多家公司又被美国列入“实体清单”;美俄乌三方谈成了!确保黑海航行安全;大摩再次上调中国股票目标

    美国商务部工业与安全局美国当地时间周二在联邦公报上刊发两份文件,将50余个中国科技企业和机构纳入所谓的“实体清单”,预期将于3月28日生效。其中一份文件中,美国商务部将一系列与中国AI大模型开发、服务器以及超级计算机产业的12家公司列入“实体清单”,包括北京智源人工智能研究院、宁畅信息产业、中科可控旗下的服务器品牌Suma,以及浪潮信息在中国内地以及港台地区…

    2025年3月26日
    3000

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信