中信证券:Grok 4推理能力跃升,期待多模态升级

Grok 4专业学科和复杂任务上的推理能力突出,展现未来模型在长流程专业工作上的应用潜力,支持Agent落地高价值场景,结合后续多模态能力有望突破打开全新应用场景,行业落地对应带动AI Infra和算力需求,建议关注相关领域重点公司的投资机会。

事项:Grok 4正式发布并开放使用。

北京时间7月10日,XAI发布新一代基座大模型Grok 4,包括Grok 4和Grok 4 Heavy两个版本,在专业学科任务推理上性能提升。模型B端API定价输入3美元/百万Tokens,输出15美元/百万Tokens,较o3大约贵50%。C端30美元/月的订阅会员即可使用Grok 4,高推理算力投入的Grok-4 Heavy版本则需要300美元/月的会员费用才可以使用。

▍重点升级专业学科和复杂任务的推理能力。

Grok 4在专业学科和商业环境推理等复杂任务中表现大幅超越此前最佳(SOTA)的模型,在知识能力上已经超越本科生和研究生水平,正在全领域快速缩小与人类顶级专家的差距。

1)HLE:在各学科专家编写的高难度学术测试集Humanity’s Last Exam(HLE)测试集中,Grok-4在不使用工具的情况下正确率为26.9%,使用工具的情况下为41.0%,在推理阶段加大RL算力投入后可进一步提升到50.7%,较此前的SOTA模型21.6%的水平翻倍增长。

2)Vending-Bench:在衡量复杂任务解决能力的商业环境测试Vending-Bench中,Grok-4得分是第二名Claude Opus 4的两倍,模型正朝着解决真实复杂问题的方向迈进。

3)其他:在GPQA、AIME25、HMMT 25、USAMO 25等专业学科知识测试集上,Grok 4 Heavy在其中4项夺冠,尤其在 AIME25与HMMT25 分别获得100% /96.7%的接近满分表现。

▍推理能力发展带动算力需求,技术创新为后续模型推理提效带来新思路。

训练侧,Grok 4较Grok 2训练量提升了100倍,较Grok-3在后训练强化学习上的计算量提升10倍。推理侧,和OpenAI o3-high相似,Grok 4 Heavy通过提高强化学习的算力投入提升模型效果,验证Test time computing的有效性。以强化学习为基础的推理能力在训推两端同步带动算力投入提升,并且根据ARC-AGI v2测试结果显示,Grok 4推理性价比(单位成本下的推理效率)显著高于此前所有模型。技术方面,本次Grok 4的工程创新包括两点:1)验证工具使用能力对推理性能的重要价值,通过在预训练阶段让模型学习使用工具,模型推理场景实际表现大幅提升;2)在后训练强化学习中找到了可靠的奖励信号方案。Grok 4的创新体现了推理能力依然是产业焦点和未来方向,工程探索为后续模型推理能力升级提供新的思路。

▍更新对话灵活、情感细腻的语音交互,多模态是后续更新计划的重点。

Grok 4发布新语音助手Eve,对话延迟降低一半,每日用户使用时长提升10倍。在现场演示中,新语音助手的对话音色、音调、语气与真人高度相似,具备模仿耳语或者演唱现编歌曲的功能。同时现场也展示了Grok-4在游戏开发领域的潜力,游戏设计师在4小时内利用AI制作出一个简单的第一人称射击游戏,发布会上马斯克提出明年有望出现首款AI游戏和首部AI电影。Grok 4当前在视觉领域的理解和生成能力仍然不足,根据马斯克发言,相关功能预计在数周到数月内的下个小版本上做重点改进。后续XAI计划在8月发布代码模型,9月发布多模态智能体,10月发布视频生成模型。

▍风险因素:

AI核心技术发展不及预期,AI被不当使用造成严重社会影响,企业数据安全风险,信息安全风险,行业竞争加剧,地缘政治风险。

▍投资策略。

Grok 4在专业学科和复杂任务上的推理能力突出,展现未来模型在长流程专业工作上的应用潜力,支持Agent落地高价值场景,结合后续多模态能力有望突破打开全新应用场景,行业落地对应带动AI Infra和算力需求,建议关注相关领域重点公司的投资机会,综合梳理以下投资主线:1)主线一:通用管理软件; 2)主线二:工具软件和其他重点行业软件;3)主线三:AI基础设施。

注:本文节选自中信证券研究部已于2025年7月11日发布的《计算机行业“智能网联”系列报告62—Grok 4:推理能力跃升,期待多模态升级》报告,分析师:杨泽原S1010517080002;丁奇S1010519120003;马庆刘S1010522090001

主题测试文章,只做测试使用。发布者:北方经济网,转转请注明出处:https://www.hujinzicha.net/35565.html

(0)
北方经济网的头像北方经济网
上一篇 2025年7月13日 上午11:00
下一篇 2025年7月13日 上午11:00

相关推荐

  • 常友科技明日申购,专注做风电机组罩体,客户集中度较高!

    兄弟姐妹们,明天又有新股申购啦! 格隆汇获悉,创业板新股常友科技将于2月18日申购。 常友科技(301557.SZ)本次发行价格为28.88元/股,发行市盈率为15.70倍,低于中证指数行业最近一个月平均静态市盈率16.43倍,低于可比上市公司平均静态市盈率42.84倍。 近年来A股打新赚钱效应较好,2024年100只上市新股中,仅1家在上市首日破发,破发率…

    2025年3月25日
    4400
  • 中金:政治局会议的金融信息

    热点速评 中共中央政治局4月25日召开会议,分析研究当前经济形势和经济工作。本篇报告对本次政治局会议中涉及金融领域的重点信息进行归纳。正文 ► 创设货币政策新工具。会议提到“创设新的结构性货币政策工具”“设立服务消费与养老再贷款”,我们预计通过定向降低银行投向消费、养老领域贷款负债成本的方式增强对银行的激励,与此前推出的支小支农再贷款、碳减排支持工具等类似。…

    2025年4月27日
    7700
  • 高溢价接盘,李红明夫妇5.4亿入主康惠制药,股价三连板

    3月20日晚,康惠制药(603139.SH)一则控股股东变更公告引起市场关注。 原实控人王延岭以每股24.7元的价格向新成立的公司悦合智创转让22%股份,交易金额达5.43亿元,较停牌前股价溢价超30%。 这场看似“蛇吞象”的资本运作背后,既有中成药企转型困境的缩影,也暗藏资本玩家跨界布局的野心。 21日开盘,康惠制药一字涨停开盘,截至发稿仍锁死涨停,成功三…

    2025年3月25日
    6600
  • 隐瞒“抽屉协议”,皇氏集团吃天价罚单

    “抽屉协议”、天价罚单,无论哪一个,对于皇氏集团来说,都是一次重创。 6年前,公司为开展基金投资业务,向出资方承诺诱人的收益,结果中途未能兑现,被诉至法院,这份“抽屉协议”随之被公之于众。 经过两年交锋,公司不仅输了官司,需赔付数亿款项,日前还受到监管部门的重罚。 这一次跨界,可谓教训惨痛,让本就主业萎缩的公司,更是雪上加霜。 皇氏集团虽然偏居广西,但掌握着…

    商业 2025年6月16日
    5000
  • 沪鸽口腔冲刺港股IPO,递表前突击分红!

    今年以来,又有不少医药公司冲击港股上市。 递表的创新药公司就有宝济药业、百利天恒、恒瑞医药、迈威生物、福建海西新药、真实生物、劲方医药等。 其中百利天恒、恒瑞医药、迈威生物三家已经在A股上市,先后转战港股寻求A+H双重上市。 此外,还有互联网医疗公司问止中医冲刺港股中医AI第一股。 近期又有一家做医疗器械的公司冲击港股上市。 格隆汇新股获悉,Huge Den…

    2025年3月25日
    6300

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信