中信证券:xAI发布Grok-3,诠释“大力出奇迹”

近期xAI发布Grok-3系列模型,作为全球首个在十万卡集群上训练的大模型,Grok-3应用了合成数据、强化学习、自我纠错机制、人类反馈循环和上下文训练等方法,模型综合能力较前代模型Grok-2提升显著。据xAI官方测评数据,在数学测试、理科测试和代码测试中,Grok-3 Reasoning性能表现超越了o3 mini(high)、Gemini-2 flash thinking和DeepSeek R1等头部模型。Grok-3系列模型的SOTA表现,意味着算力堆积仍是模型进步的关键变量之一。中信证券判断产业在追逐AGI模型的方向上有望不断加速,进而对算力需求形成持续拉动,同时主要模型厂商在复杂推理层面的不断加码,亦有望推动下游应用的不断解锁,从而在中期构建更为健康、均衡的AI产业生态。

事项:

北京时间2月18日中午12点,马斯克创立的大模型初创公司xAI发布了其最新一代大模型Grok-3以及其相关变体版本Grok-3 Reasoning、Grok-3 mini和Grok-3 mini Reasoning,引发资本市场高度关注。

根据xAI官方X平台账号,Grok-3是xAI基于其部署于田纳西州孟菲斯的Colossus超级计算机训练得到的,消耗的计算资源等效于2亿小时H100支持的GPU训练时长,是上一代模型Grok-2的10倍以上。根据xAI官网,Colossus超级计算机至少包含10万张H100,由此中信证券预计预训练阶段消耗时长超2000小时(83.3天)。

此外在发布会上,马斯克还宣布在Grok-3成熟稳定后(马斯克预计几个月之后),xAI发布的上一代模型Grok-2将开源。根据xAI官网,在2024年Grok-2发布后,xAI也以Apache2.0开源协议了总参数规模达3140亿的MoE大模型Grok-1。

模型效果与实现机理:算力堆积、强化学习等显著提升模型综合、推理能力。

作为全球首个在十万卡集群上训练得到的大模型,Grok-3测评结果亮眼,在多项测试中均处于行业领先地位。

根据xAI发布会,在数学测试AIME、博士水平理科测试GPQA和代码编写测试Coding(LCB Oct-Feb)中Grok-3得分分别为52/75/57,性能表现超越了Gemini-2 Pro、DeepSeek V3、Claude 3.5 Sonnet和GPT-4o等主流模型;Grok-3 Reasoning得分分别为93/85/79,性能表现超越了o3 mini(high)、Gemini-2 flash thinking和DeepSeek R1等头部推理模型。而在Chatbot Arena这一评估AI模型受人类欢迎程度的测试中,Grok-3的早期版本得分达到了1402,高于Gemini 2.0 flash think、GPT-4o、DeepSeek R1和o1等头部大模型。

根据xAI官方X平台账号,中信证券认为Grok-3的性能优秀的成因有以下2点:1)庞大的算力投入带来了模型能力的涌现,根据xAI发布会,Colossus超级计算机在完成第二阶段建设后集群规模扩展至20万张H100;2)合成数据、强化学习、自我纠错机制、人类反馈循环和上下文训练等训练手段的应用。

市场定位:面向付费用户,能力提升有望解锁更多潜在场景,成本有待优化。

根据xAI发布会,目前Grok-3将率先于推特的Premium Plus用户中推广,该订阅计划目前每月订阅费用为40美元。同时,xAI还发布了由Grok模型支持的Agent产品DeepSearch。该Agent产品能通过扫描互联网和推特来获得并分析信息,最终总结回复。根据xAI发布会,DeepSearch和无限的图像生成功能将包含在SuperGrok这项独立收费计划中,预计订阅费用为每月30美元(年度订阅为300美元)。此外,Grok-3的企业级API预计将在几周后上线。在xAI发布会中,官方还展示了如何用Grok自动化游戏开发。中信证券认为模型能力的不断提升下,AI应用场景有望进一步解锁;而对比Grok-3与的ChatGPT的定价水平(20美元/月),并考虑到目前仍处于市场教育抢占份额阶段,中信证券认为Grok-3的推理成本有待进一步优化。

趋势展望:基础模型演进节奏加快,合成数据&强化学习等值得持续关注。

根据IBM和MIT研究者的论文《A Hitchhiker’s Guide to Scaling Law Estimation》(Choshen,Zhang和Andreas,2024),理论上来看现阶段预训练Scaling Law依旧有效。而根据各公司官网,2024年Inflection、Adept和Character AI等海外明星模型初创公司均已放弃预训练,并将重心转向后训练与推理技术(如Agent技术等)。

中信证券认为该变化主要成因有如下2个方面:1)万卡乃至十万卡级别算力集群投入过高:根据Pytorchtoatoms官网的测算,Meta于2024年3月推出的4.9万卡算力集群建设+4年运营成本达到了12.87亿美元;2)高质量数据匮乏:根据2024年NIPS会议上AI科学家伊利亚演示材料,预训练在未来或将受限于互联网数据耗尽。但Grok-3的出现不仅在实践上证明了现阶段预训练Scaling Law依旧有效,也表明了合成数据和强化学习技术的重要性。由此中信证券预计少数头部公司仍将继续加大预训练投入,并在合成数据和强化学习上进行更多探索。

风险因素:

AI核心技术发展不及预期风险;科技领域政策监管持续收紧风险;私有数据相关的政策监管风险;全球宏观经济复苏不及预期风险;宏观经济波动导致欧美企业IT支出不及预期风险;AI潜在伦理、道德、用户隐私风险;企业数据泄露、信息安全风险;行业竞争持续加剧风险等。

投资策略:

本次Grok-3模型的发布仍然是围绕底层算法层面,尤其是大语言模型的综合、推理能力。从技术角度,Grok-3的性能表现在庞大算力、多种训练手段加持下得到显著提升,体现了头部公司在基础模型+推理能力两个方向的持续聚焦。应用层面,尽管Grok-3的成本在短期可能限制了其应用场景的开阔,但是随着工程能力的进步和底层算法能力提升带来的通用推理能力的进步,中信证券认为AI爆款应用有望从科研、编程等高价值场景起率先解锁,软件、互联网有望率先受益。除去应用端的投资机会,硬件端的需求也必然会随着多模态的技术进步而不断提高,中信证券仍然持续看好AI算力层面,尤其是得益于商业端逐步成熟而带来的更多的AI推理侧算力的机会。

注:本文节选自中信证券研究部已于2025年2月19日发布的《前瞻研究全球AI人工智能产业重大事项点评—xAI发布Grok-3,诠释“大力出奇迹”》报告,分析师:陈俊云S1010517080001;许英博S1010510120041;贾凯方S1010522080001;高飞翔S1010523060003

主题测试文章,只做测试使用。发布者:北方经济网,转转请注明出处:https://www.hujinzicha.net/5683.html

(0)
北方经济网的头像北方经济网
上一篇 2025年3月25日 下午3:07
下一篇 2025年3月25日

相关推荐

  • 早报 (04.02)| 数次熔断!两天暴涨2230%;“SU7爆燃致3人死亡”事故,雷军深夜发声:不会回避;身家3420亿美元!马斯克登顶全球富豪榜

    新势力3月稳步升温:零跑首次登顶交付榜小鹏连续5个月交付破三万——零跑汽车3月交付量达到37,095辆,同比增长154.65%;理想汽车3月交付新车36,674辆,同比增长26.53%;小鹏汽车3月共交付新车33,205辆,同比增长267.88%,蔚来在3月交付新车15,039辆,同比增长26.74%。比亚迪3月销量达37.74万辆,一季度累计销量突破百万大…

    2025年4月2日
    7800
  • 早报(07.18)| 刚刚!美国稳定币法案通过;特朗普被确诊患静脉疾病;中东11国联合声明反对!中国资产爆发,蔚来狂飙近7%

    美国众议院通过《天才法案》。当地时间7月17日,美国国会众议院以308票赞成、122票反对的结果通过了《指导与建立美国稳定币国家创新法案》(简称《天才法案》),现距生效仅差特朗普签字;下一步美国国会将推进对加密货币行业的框架性立法。 外国投资者5月增持美债 中国四连降。美国财政部公布的数据显示,5月外国投资者持有的美国公债有所增加,连续第三个月超过9万亿美元…

    2025年7月18日
    6300
  • 不要浪费任何一场危机

    懂王的王炸,终于出来了。 全球咂舌,最终的关税税率,几乎超过所有主流机构、主流经济学家的预测,全球多数对美贸易的国家,个个中招。而原先的各种温和的、中性的预测,最后也都落了单。 美股自己也先跪了,盘后股指期货、各大公司股价全线下跌,几乎无一幸免。 今日A股、港股走势也出现波动,有些板块出现下跌,但也表现出一定的韧性。 短期看,悲观情绪依然很浓,应该管住手。 …

    2025年4月3日
    9900
  • 中美会谈下,自主可控板块的节奏与机会

    核心观点 中美双方经贸协商未完待续,自主可控仍是长期逻辑。自主可控的第一个逻辑是国家政策多年布局下的积累;自主可控的第二个逻辑是国产替代。穿透到二级行业,短期可以关注估值处于低位的方向,中期关注产业节奏。估值方面,前期估值处于低位的板块主要为军工、医药、电子;产业节奏方面,军工→信创→医药→先进制造。 正文 中美关税会谈破冰后,双方经贸协商未完待续,自主可控…

    商业 2025年6月9日
    8000
  • 欧股上涨能否持续?如何交易?

    开年以来欧股表现较好,结构上大盘领跑,权重股贡献显著,中小盘开始catch-up。欧股上涨可否持续?产业角度,欧股不易受到类似DeepSeek事件冲击。估值角度,欧央行降息将提振估值,欧股与美股相比明显“便宜”。盈利角度,欧元区政策组合拳预计将刺激经济,整体盈利有望增长。地缘和政治角度,欧洲政治不确定性下降,相对美股折价有望继续减少。资金流角度,美国被动资金…

    2025年3月25日
    9600

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信