梁文锋等来及时雨

本文来自微信公众号：字母榜，作者：赵晋杰，题图来自：视觉中国

被梁文锋靠着DeepSeek抢走风头近180天后，杨植麟正借助Kimi更新试图卷土重来。

近期，Kimi K2新模型发布后，引来外部试用高潮。Perplexity CEO阿拉温德发文称，内部将很快用K2进行后训练，以对外提供服务。此前DeepSeek R1上市后，也被第一时间引入Perplexity。

试图通过模型更新从DeepSeek手中抢回注意力的不止Kimi一家。据字母榜获悉，7月底，“AI六小龙”中的阶跃星辰、智谱AI，都将发布自研的新一代基础大模型，科大讯飞也将赶在月底推出自家全新模型。

当一众大模型玩家都在比拼模型更新和产品体验之际，迟迟没有大动作的DeepSeek，不出意外迎来了自身流量和产品使用率的下滑。

DeepSeek自1月以来的爆发式增长，仅持续了2个月时间。从4月份开始，DeepSeek月活跃用户数便掉头向下。QuestMobile数据显示，截至5月份，DeepSeek月活跃用户规模为1.69亿，环比下滑5.1%。

随着月活用户规模下降，DeepSeek的下载量排名也急速下坠。曾经一度在中美两地的苹果App Store 免费应用下载榜上夺冠的DeepSeek，如今已经被挤到了30名开外。

来自SemiAnalysis半导体研究机构的一份报告，更是直观展现了DeepSeek在用户使用率方面的下降态势——从年初7.5%的峰值，回落至5月底的3%，官网访问量也同期下降了29%。

梁文锋并非没有准备。早在2月份，路透社就曾爆料，DeepSeek内部正在加速推出R2模型，该模型原计划在5月初发布，但现在官方希望能尽早发布。

但直到7月中旬，R2模型仍迟迟未见。The Information曾爆料称，阻挡R2模型上线的一大原因是，英伟达H20芯片的意外禁售，使得DeepSeek在算力储备上出现紧缺状况。梁文锋担心新模型一旦上线，会因为短时间内调用量过高而造成体验不佳。

年初R1模型爆火后，梁文锋的低成本大模型训练方法，还意外带火了H20芯片在国内的需求。

自2023年以来，H20芯片是英伟达可合法出口至中国的最强AI芯片。但在DeepSeek影响之下，4月份，美国对其实施新的出口管制许可，其被禁止卖入中国市场。

如今，上述禁令终于迎来转机。7月15日，在黄仁勋年内第三次访华之际，英伟达官方公告，公司正在提交重新销售H20芯片的申请，且美国政府已向英伟达保证将授予许可证，接下来，公司将尽快启动交付程序。

面对被同行抢跑的竞争格局，高端算力遇阻的梁文锋，意外等来了黄仁勋送来的一场及时雨。

一

R1发布近半年来，动作寥寥的DeepSeek，不可避免陷入不进则退的现实困境之中。

在国内其他大模型玩家卯足劲头追平乃至超过DeepSeek模型性能之际，梁文锋只是带领团队出着一些小招式，如DeepSeek V3模型完成小版本升级，上线新版本DeepSeek-V3-0324，随后又更新了以DeepSeek-V3为基础模型微调而来的DeepSeek-Prover-V2——一款数学定理证明模型。

最近的一次动作还要数5月底完成的DeepSeek R1小版本升级。但值得注意的是，DeepSeek-R1-0528仍然使用的是2024年12月所发布的DeepSeek V3 Base模型微调而来，并非基于新一代的V4模型。

官方介绍中，DeepSeek-R1-0528更多是在后训练过程中投入了更多算力，以此来提升模型的思维深度与推理能力，其在数学、编程等方面的整体表现，逼近OpenAI o3与谷歌 Gemini-2.5-Pro等国际顶尖模型。

但缺乏大版本升级，只是在小版本上修修补补的DeepSeek，遭遇的直观后果之一便是，外界给其贴上的性价比标签，正在一点点被重新撕下。

一贯以性价比开道的DeepSeek，在过去近半年内，正在被阿里、字节、百度等科技大厂夺走自身的性价比标签，科技大厂纷纷推出了API价格更低的同类模型。

百度创始人李彦宏更是贴脸开大，吐槽DeepSeek除了没有多模态之外，使用起来还慢且贵，“中国市场上绝大多数的大模型API调用价格都比DeepSeek满血版要低，而且速度也更快。”

现在，蓄足实力的“AI六小龙”们，通过新的模型更新，也开始在性能和价格上纷纷挑战起DeepSeek的性价比。

7月份新上线的Kimi K2模型，同样选择了开源，并成为国内开源领域首个总参数量达到1万亿的MoE架构基础模型。

官方介绍，在SWE Bench Verified、Tau2、AceBench等一系列基准性能测试中，Kimi K2 均取得开源模型中的SOTA成绩，在DeepSeek擅长的代码、数学推理任务上实现了反超。

价格上，Kimi K2每百万输入tokens收费4元，每百万输出tokens收费16元，对齐了DeepSeek在标准时段（8点半到夜间12点半）的API价格体系。

Kimi之外，6月中旬更新的MiniMax-M1模型，号称世界上第一个开源的大规模混合架构推理模型，其号称整个强化学习阶段只用到512块H800三周的时间，租赁成本只有53.47万美金。对比DeepSeek，其V3模型训练是在2048块H800上实现的，总花费约为557万美元。

二

摸着DeepSeek过河的一众国产大模型玩家，纷纷在模型性价比上完成了抢跑。对比国外的OpenAI，尽管各家也都在推出各类平替模型，但OpenAI的总调用量依然保持稳定的秘诀，主要在于其在基础模型能力上依然保持着行业头部的水平，始终领先着竞争对手将近一代的差距。

相比之下，DeepSeek爆火出圈的R1，也只是做到了比肩o1的水平，而非彻底超越OpenAI的存在。所以，这也能部分解释为什么短短半年内，DeepSeek官方应用和官网流量就相继迎来了下跌，而ChatGPT却依然维持稳定增长。

不过，需要注意的是，尽管DeepSeek自身流量在下滑，但在第三方平台，R1和V3模型的总使用量仍在持续快速增长。SemiAnalysis给出的数据显示，第三方平台托管的 R1 与 V3 使用量，自R1发布以来已增长近 20 倍。

之所以会造成上述反差局面，SemiAnalysis认为DeepSeek更多是败在了Token经济学上。

虽然外界一般都以每百万 tokens的价格来衡量各个模型的性价比，但这一方法并不总是有效或合理，“因为这忽略了具体工作负载和用户需求。”SemiAnalysis分析师指出。

包括延迟（模型生成首个 token 所需时间）、吞吐率（每个token的生成速度）、上下文窗口等因素的差异，都会对最终的token消耗成本产生直接影响。

典型如 DeepSeek 为了在推理资源有限的情况下提供便宜模型，其上下文窗口严格控制在了64K，是一众主要模型提供商中最小的之一。

与之对比，近期更新的Kimi K2，支持最长128K上下文。更早之前更新的MiniMax-M1，更是支持业内最高的100万上下文输入，是DeepSeek R1的8倍。

当然，这更多是 DeepSeek主动选择的结果。在一众大模型玩家中，梁文锋不仅主动选择了开源，且还直接表现出了对C端应用毫不在意的商业考量。追求并实现AGI，才是梁文锋视野中的头等大事。

三

但DeepSeek终究不是一家慈善机构，梁文锋尽管追求模型开源，他最终想要的也是借助开源生态实现预期的商业化。

基于此，维持开发者群体的活跃，和自家产品的用户使用率，不仅必要，而且对大模型玩家来说更是多多益善。

如何重新激活外界对DeepSeek的兴趣，最直接的解决办法，无疑便是尽快推出新模型V4和R2。

这方面，奥特曼已经为梁文锋做了最佳现身说法。在DeepSeek抢走行业热度后，奥特曼几乎以每周都有新产品的更新频率，让OpenAI牢牢定在了AI热搜榜上：在模型侧推出了GPT 4.5、o3-mini/o4、GPT 4.1；在产品侧上线了Operator、Deep Research、Codex；在体验侧，学习DeepSeek开放思维链，并主导了吉卜力风格图片的流行。

上述动作背后，都藏着奥特曼对OpenAI模型调用度规模的追求。全球最大的大模型整合应用平台Poe，在此前发布的《2025年春季人工智能模型使用趋势》报告中指出，OpenAI的GPT-4.1系列发布后几周内，份额迅速增加到了约10%，位列第一。对比DeepSeek，其R1模型使用率，已从2月中旬的峰值7%下降到了4月底的3%，整体使用率下降超过50%。

在通用Agent大爆发的当下，除了推出新模型之外，梁文锋或许还该考虑如何补上模型调用工具的能力短板，以满足更多AI开发者的新需求。

晚点LatePost 就曾爆料称，字节扣子团队开发扣子空间时，他们曾考虑优先使用DeepSeek-R1，但测试后发现其调用工具的能力不太理想，最终还是用了自家的豆包模型。

环比市面上主流的AI助手类应用，DeepSeek是唯一暂不支持多模态功能的产品。1月15日应用上线至今，6个月过去，如语音对话、图片生成、音乐生成、视频生成等，DeepSeek仍未提供支持服务。

作为通向AGI重要途径的多模态，其重要性正随着Agent生态的发展日益凸显。如果梁文锋再不向外界亮大招，其还将迎接更加现实的竞争挑战，即可能会将更多模型调用需求推向对手。

毕竟，现实环境中，从MiniMax到Kimi，其在最新更新的模型中，无一例外都强调了调用工具来构建Agent的特性。

借助R1开启深度思考浪潮后，梁文锋还能为Agent时代创造出新的惊喜吗？

本文来自微信公众号：字母榜，作者：赵晋杰

本内容为作者独立观点，不代表虎嗅立场。未经允许不得转载，授权事宜请联系 hezuo@huxiu.com

本文来自虎嗅，原文链接：https://www.huxiu.com/article/4581106.html?f=wyxwapp

主题测试文章，只做测试使用。发布者：北方经济网，转转请注明出处：https://www.hujinzicha.net/36242.html

梁文锋等来及时雨

一

二

三

发表回复

联系我们

400-800-8888

梁文锋等来及时雨

一

二

三

相关推荐

被讨伐的啄木鸟平台，与寄生的县城二舅们

亚裔AI人才的硅谷晋升之路，被一张绿卡阻断了？

万亿中国平安，寻找估值新「锚」

104岁的中国最美大学，走出一支IPO军团

成功干出中国芯那天，他说，走，我们向毛主席报喜去

发表回复

联系我们

400-800-8888