中信证券:从华为384超节点看下一代AI系统级算力

大模型架构创新以及推理需求的日益增长对底层基础设施建设提出了新的要求,面向未来的AI基础设施须具备前瞻性、通用性。

当前,单芯片算力提升对算力集群能力提升的边际效应在递减,内存通信、片间互连、网络通信成为瓶颈。为解决这一问题,技术角度,产业迈向Scale up扩展,通过提升单节点计算资源密度及高效的网络架构提升算力利用率。

行业趋势上,半导体芯片行业通常以收并购的方式获取技术能力及市场拓展,以海外为代表的龙头公司做出了成功示范。系统级算力有望成为AI基础设施的下一站,建议关注国内以华为CloudMatrix384超节点为代表的产业发展趋势。

▍系统级算力有望成为下一代AI算力基础设施。

我们认为,底层基础设施的通用性就是为了前瞻性地应对未来的模型发展。当前AI产业发展迅速,Scaling law在后训练、在线推理等阶段快速发展。训练端,模型架构持续创新迭代,有望进一步强化训练侧scaling law的延续,如阿里巴巴Qwen团队与浙江大学团队提出的Parallel Scaling、腾讯混元团队采用Transformer、Mamba混合架构训练的TurboS都取得了优秀的性能表现。推理端,在MoE专家网络架构成为主流后,如何通过硬件部署实现更高的吞吐量和更低的延时成为焦点。我们认为,采用类似推理集群的形式未来有望成为主流,计算节点有望通过提升计算密度满足推理需求。系统级算力料将成为下一代AI算力基础设施。

▍系统级算力需要系统级能力。

芯片层面,算力集群中涉及AI加速芯片、CPU芯片、Switch互连芯片、DPU数据处理芯片等,受限制于制程,国产AI加速芯片在峰值算力能力领域上相较于海外旗舰产品仍有差距,软件生态上亦因产业发展时长而相对落后,单芯片能力的竞争并无直接优势。互连层面,传统PCIe与英伟达NVLink等差距较大,NVLink5.0提供1.8TB/s双向带宽,超传统PCIe方案的十倍,国产芯片采用自研技术方案助力系统集群发展。网络层面,系统算力采用RDMA技术实现远程内存访问,目前主流技术方案包括InfiniBand、RoCE等。整机层面,系统级算力并非是上述部件的简单组装,而是通过系统设计、规划、测试完成的有机整体,与以往传统AI服务器相比更需要垂直融合能力,产业上下游之间的关系也将随着组件之间耦合程度的提升而变得更加紧密。生态层面,CPU+GPU+互连+网络+整机+系统交付成为系统级算力入局门槛,海外巨头通过收并购的方式已构筑起产业生态。

▍技术角度,英伟达NVL72、华为CloudMatrix384超节点先行示范。

当前,单芯片算力能力的发展已显著快于通信领域的发展速度,通信效率成为集群效率提升的关键因素。构建大集群的方式主要两种:1)Scale up(纵向扩展),增加单节点的资源数量;2)Scale out(横向扩展),增加节点数量。相较于Scale out网络,Scale up能够提供更大的带宽、更低的通信时延,和更大的缓存一致性内存空间,因此Scale up即在单节点增加资源数量成为未来发展的重要方向,如2024年3月英伟达在2024GTC大会上发布的NVL72系统、2025年4月华为在华为云生态大会上发布的CloudMatrix384超节点为行业发展提供思路。

▍产业维度,半导体行业通常以收并购方式进行技术整合与市场拓展。

半导体行业长坡厚雪,产业链涉及环节较多且技术复杂,整机资源耦合程度提升,上下游协作变得愈发紧密。因此,头部企业通常采用投资并购的方式来获取进入市场的机会,同时进一步扩展技术能力以巩固市场地位。英伟达通过收购Mellanox,将原有的NVLink(主要用于Scale up)连接技术,扩展至IB等RDMA网络(用于Scale out),从而为下一代大规模计算集群做好技术储备;AMD通过收购ZT Systems获取了系统架构设计能力以及数据中心解决方案交付经验,EPYC CPU以及Instinct GPU、网络、软件及ZT Systems的集群系统交付能力共同构建了AI解决方案的核心。我们总结,在面向未来基础设施搭建的领域,底层通用性与技术前瞻性是至关重要的,在此基础上,应用的发展将会随之带来回报。

▍风险因素:

算力芯片供应链风险;芯片产能供给不足的风险;互联网大厂资本开支不及预期的风险;相关产业政策不及预期的风险;AI应用发展不及预期的风险;芯片技术迭代不及预期的风险;国产GPU厂商竞争加剧的风险等。

▍投资策略:

当前AI大模型的训练、推理需求持续旺盛发展,scaling law在后训练、在线推理等方向上持续演进。底层基础设施朝着更大集群的方向发展,单芯片的算力提升在先进制程的影响下未来迭代速度料将放缓,而系统级节点有望通过解决互连、网络、内存墙等问题成为AI算力发展的重要方向。

从近期算力龙头企业系统级产品的发展趋势以及过往半导体行业的并购历史来看,系统级算力有望成为AI发展的下一站,国产GPU芯片公司有望通过打造更高资源密度的算力基础设施实现对海外产品的追赶和超越。

建议关注:1)英伟达NVL72等系统级产品出货情况;2)以华为CloudMatrix384超节为代表的国产系统级产品进展,建议关注国内产业链相关公司。

本文节选自中信证券研究部已于2025年6月25日发布的《计算机行业“构筑中国科技基石”系列报告43—从华为384超节点看下一代AI系统级算力》报告,分析师:杨泽原 丁奇S1010517080002 S1010519120003 等。

主题测试文章,只做测试使用。发布者:北方经济网,转转请注明出处:https://www.hujinzicha.net/32053.html

(0)
北方经济网的头像北方经济网
上一篇 2025年6月26日 上午11:01
下一篇 2025年6月26日 上午11:01

相关推荐

  • 中金:推迟美联储降息预测至第四季度

    摘要 中美日内瓦会谈后双边大幅削减关税,美国经济衰退风险降低。 然而,15.5%的有效税率仍较去年的2.4%明显抬升,通胀风险并未完全解除。历史经验表明,涨价一般发生在关税全面落地后的2-3个月,最新的通胀数据还无法反映这一点。 我们认为,关税缓和将使美联储对就业(衰退)的担忧下降,进而更加看重通胀风险,这意味着美联储或将继续观望,等待更清晰的通胀数据。我们…

    2025年5月16日
    6400
  • 3月70城房价:上海环比涨0.7领跑,二三线城市环比总体降幅收窄

    4月16日,国家统计局公布2025年4月份70个大中城市商品住宅销售价格变动情况。 新建商品住宅销售价格方面,上海环比涨0.7%领跑,北京、广州、深圳分别跌0.2%、跌0.1%、涨0.1%。 国家统计局城市司首席统计师王中华对上述数据进行解读称,3月份,从环比看,住房市场成交活跃度提升,70个大中城市中,商品住宅销售价格环比上涨城市个数增加;其中,一线城市商…

    2025年4月16日
    6700
  • 香港新股火爆!周六福、颖通控股等消费公司都招股中,怎么看?

    港股打新市场尤为火爆,在香江电器和曹操出行结束招股后,目前还有圣贝拉、周六福、颖通控股、泰德医药、IFBH、云知声等六家新股处于招股期。 尽管港股打新的中签率远高于A股,但港股新股并不像大A新股一样上市首日都收涨,所以港股打新更考验投资者的眼光。截至6月20日,今年港股IPO上市的31家新股中,上市首日有19家收涨、3家收平、9家破发,首日上涨概率约61%、…

    商业 2025年6月21日
    2500
  • 隔夜美股全复盘(5.14) | Coinbase暴涨24%,获纳入标普500指数,5月19日生效

    01 大盘 昨夜美股除道指外,均收涨。截至收盘,道指跌 0.64%,纳指涨 1.61%,标普涨 0.72%。恐慌指数VIX跌 0.92%至18.22。美元指数昨日跌 0.81%,报100.98。美国十年国债收益率跌 0.089%,收报4.469%,相较两年期国债收益率差46.5个基点。现货黄金昨日涨 0.47%,报3249.86美元/盎司。布伦特原油收涨 2…

    2025年5月14日
    5000
  • 中信证券:预计稳健配置类产品有望迎来发展契机

    近年来国内财富管理市场规模持续增长,我们预计2025年国内居民个人金融资产总量有望迫近300万亿元。对比海外,国内居民金融资产配置更趋保守,多元化转型有望成为财富管理市场的未来趋势。在无风险收益下行与资产轮动速度加快的背景下,中低风险维度策略存在供给缺失,预计稳健配置类产品有望迎来发展契机。基于此,我们构建两类财富配置解决方案:低波版的红利主题优选+债券久期…

    商业 2025年5月22日
    4100

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信