混沌初开:国产大模型在沸腾中“求索”

观点 | 2023-05-31| 40
混沌初开:国产大模型在沸腾中“求索”

校对:莽夫

ChatGPT持续狂飙,国内大模型诸神之战同样愈演愈烈。

百度、阿里、360等大科技公司相继推出大模型产品并高速迭代,加快应用落地;智谱AI、澜舟科技等创新创业公司也进一步拓展在大模型上的布局,加速百亿、千亿级别大模型自研进度。

中国版ChatGPT之争的背后,事实上是技术(大模型数据、算力、算法)、资金、人才各个方面的长期较量。谁能在大模型能力上领先,率先应用落地,布局商业化,谁就有可能在AI 2.0时代掌握话语权。

Part.1、创业者们的三大难关:钱、技术、人才

大模型烧钱是赛道参与者的共识。启明创投合伙人周志峰在媒体采访时表示,一家大模型创业公司从起步到发布到第一个较成熟的的模型,完成商业化验证,至少需要2亿美元。

旷视CEO印奇也曾透露,训练出GPT-3.5至少需要1万张A100的芯片集群,硬件投入需要20亿元。

入局者先备钱。王慧文个人投资5000万美元成立公司,李开复圈宣布筹组中国版ChatGPT公司“Project AI 2.0”之前,资金就已先到位。此前,李开复相继减持知乎、美图套现近1.5亿。创业公司澜舟科技也在今年完成Pre-A+轮融资,融资额达数亿元。

融到钱才能活下去。资金成为依靠风险投资的大模型创业者们首先要解决的问题。尽管在ChatGPT的带动下,资本机构当前看好这一赛道,但主要以明星项目、明星团队为主。当创业者短期内不能明确营利模式和研发成果转化,市场对于创业公司不会有太多的耐心。

头部科技公司同样面临相似问题。在众多大厂正在或即将迎来组织架构调整和改革的背景下,除百度将大模型上升为核心战略外,其余“浅尝”中的大厂,集团对于大模型的长期投入、业务场景落地和战略定位也会有更严苛的考核。

这种情绪上的急迫,主要来自于时间窗口期的压缩。海外科技巨头在大模型技术和应用上的不断突破,留给国内厂商的追赶时间不会太久。

技术能力是影响大模型竞争格局的核心。大模型对于算法、算力和数据的要求都格外高,而互联网大厂拥有更为深厚的技术储备。人才资源上的争夺也同样如此。作为大模型竞争中的重要一环,大厂和资金实力丰厚的企业对于人才拥有更强的吸引力。

杭州未来科技城曾有一家公司招聘AIGC方向算法工程师,年薪最高可达320万的消息引起热议。AIGC人才站上高薪风口,AI企业展开新一轮抢人大战。脉脉高聘人才智库最新调研数据显示,今年1-2月AIGC人才需求逆势上涨,岗位数量同比增长31.3%,创下历史新高。

AI公司对顶级人才的渴望可见一斑。王慧文表示要拿出新公司光年之外75%的股份用于邀请顶级研发人才;王小川通过公开信呼唤中国领军人物、行业产品经理和远在美国的同仁加入;李开复邀请全球世界范围内的人才一起打造世界级的公司…

大模型疯狂抢人的背后,是AI公司对于当下转瞬即逝的机会窗口的急迫把握。毕竟在全球经济周期性下滑的今天,下一个像AI大模型这么具有想象力的科技商业机会,不知能在何时又会以何种形式出现。

Part.2、AI新机会:通用大模型or应用层垂直模型

摆在国产大模型入局者的机会和选择有两个:通用大模型与应用层垂直模型。

大厂更具有开发通用大模型的野心和能力。当前模式主要是以通过提供底层通用平台,吸引更多开发者和合作伙伴一起发展,打造全新AI生态为主。不仅惠及云计算业务,主流商业模式也从IaaS(基础设施即服务)转向MaaS(模型即服务)。

在具体应用上,阿里云通义千问大模型将全面接入阿里办公、购物、语音助手等场景,中兴通讯、吉利汽车、波司登、掌阅科技等多家企业表示将与阿里云在大模型场景展开技术合作。

百度文心一言已经覆盖政务、金融、媒体、电商零售等场景,在医药领域,百度发布GBI-Bot,成首个落地医药行业的产品。在汽车领域,长安汽车官宣逸达将成为国内首款搭载文心一言的量产车型,后续将通过软件升级的形式搭载至新车。

相比通用大模型,垂直大模型对于算力、算法的要求会低一些。作为一种全新的生产力,随着垂直大模型底层能力的不断突破,必然能实现企业的降本增效,带来上层应用的迭代和变革。

李彦宏曾直言,“中国的OpenAI不是创业公司的机会,没有必要再重新发明一遍轮子。”“有了轮子之后,做汽车、飞机,价值可能比轮子大多了。”

一些不具备技术、资金竞争实力的中小型企业和创业者们,在垂直领域积累了大量数据和know-how,选择以开源或合作大模型+外挂领域知识库的方式,瞄准应用层垂直模型机会,从细分行业切入解决特定场景的市场需求。

例如深兰科技已经开发出面向个人数字化的硅基知识大模型,主要用于进行知识的个性化和专业化预训练。

面向教育领域,学而思正在自研数学大模型,有道发布了基于“子曰”大模型研发的AI口语剧透视频。面向生物领域,上海人工智能研究院、祥符实验室、转化医学国家科学中心(上海)联合发布全国首个DNA存储领域预训练大模型“ChatDNA”…

通用大模型和垂直模型将构成新的AI行业格局。通用模型大而全,能适应千行百业,拥有更多的商业场景和更大的商业市场。垂直领域模型小而专,可以更精准地服务特定行业和特定人群,更易落地且进行商业化。

但无论是通用大模型还是应用层垂直模型,AI企业都有机会跑出来,在“每个行业都值得用AI重构一遍”的时代变局中。

Part.3、信心之外:无法回避的残酷追赶现实

尽管国产大模型研发全面加速,但无论是百度、阿里这样的国内科技巨头,还是信心满满的创业者都无法回避的残酷现实是,自家产品与快速成长和落地OpenAI存在不小差距,即便没有王小川认为的OpenAI比国内领先三年之久,但也远不到“上来就说能超越”,周鸿祎直言不讳,“那才叫吹牛”。

与海外科技巨头相比,中国大模型厂商在数字基建上面临着硬件条件的“先天不足”,在数据和算力等方面存在明显短板。

在算力层面,英伟达A100芯片构成了ChatGPT训练大模型的算力底座,目前市面上几乎没有英伟达GPU产品在AI大模型训练上的替代品。但由于GPU出口限令,死死卡住了中国AI算力的脖子,中国企业只能使用存量的A100和传输速率只有A100三分之二的A800。

大模型实现数量级飞跃离不开GPU算力加持,如果算力跟不上,会导致大模型的差距进一步拉大。

在数据层面,大模型的发展依赖于高质量的训练数据集,而国外数据集要领先中国很多。目前国内基于中文语义的大模型训练所需要的中文数据总量不够,而且质量不高。国外企业可以直接使用各类整理好的公开数据训练AI,但国内企业还需要付出额外的人力和资金成本来采集、清洗、标注获得的数据。

不久前,腾讯云曾联合上海大学举办的人工智能数据标注大赛,被网友调侃“思路清奇”,“1.8万元买到了120位大学生的40个小时用来做数据标注”,虽在网络上引起不小争议,但活动发出短短数小时后便显示“名额已满”。

此外,优质中文大模型训练语料的稀缺也会加大中国大模型和国外大模型的差距。技术差距下,中国大模型厂商正在通过后天努力,奋力追赶,以期“大力出奇迹”。

一方面,中国科技公司加速自研AI训练芯片,寻找国产替代化方案,以此来解决算力之困。例如超过英伟达A100八成能力的百度昆仑芯片,目前已经更新到第二代,量产几万片;第三代则预计于2024年实现量产。

此外,据华为透露,目前昇腾AI基础软硬件平台已孵化和适配了30多个主流大模型,超过一半的中国原生大模型基于昇腾AI孵化。有消息称,华为即将推出的昇腾920性能可以达到英伟达H100水平。此消息如果成真,将大大缓解国内日益增长的AI算力需求压力。

另一方面,政府和企业都在积极寻找破解数据之困的方法。政府层面,数据要素政策频出,通过建立国家数据局来协调推进数据基础制度建设,统筹数据资源整合共享和开发利用。同时,各地积极推动数据交易所建设,加速数据自由流通,缓解国内优质数据集不足的问题。

产业层面,越来越多的数据服务商将数据加工处理、数据分析服务等方面帮助企业构建高质量数据集,提高数据质量的同时,加快大模型的研发效率。

国产大模型竞赛才刚刚开始,面对这个比移动互联网还庞大多倍的AI机会,所有参与者都全情投入,尽锐出战,紧抓来之不易、稍纵即逝的窗口期。

即便竞争异常激烈,即便难关重重,但都在朝着更创新的技术、更易落地的应用、更明晰的商业化路径方向走去。

标签:, ,

相关推荐相关推荐

“逆势涨价”刺激大涨?特斯拉逆转颓势,创年内最大单日涨幅

“逆势涨价”刺激大涨?特斯拉逆转颓势,创年内最大单日涨幅

一夜涨超2364亿元 美东时间3月18日,特斯拉大涨超6%,创近6个月单日最大涨幅,收报173.8美元,最新总市值5524.97亿美元。公司市值一夜涨超328亿美元,约合人民币2364亿元。消息面上,当地时间3月16日,特斯拉宣布,将于3月22日在多个欧洲国家提高其M ...

观点 28 2024-03-19
完美故事的尾声,实物的再度崛起

完美故事的尾声,实物的再度崛起

美国财富分配变化已至,新中产开始崛起 【报告导读】在软着陆(通胀回落+经济避免于衰退)+人工智能技术进步+俄乌冲突后美国秩序重建的叙事下,2023年无疑是属于以美股为代表的金融资产的一年。市场忽视的是,在美国奇迹下各部门之间的分化。这一分 ...

观点 24 2024-03-19
AI手机,消费电子新篇章

AI手机,消费电子新篇章

手机端或有望形成新的流量入口,深刻影响手机厂商商业模式。 继AIPC后,我们看到AI手机在模型侧、硬件侧、操作系统及应用侧均存在产业升级趋势,未来AI手机或将重塑手机行业生态。摘要AI手机:把大模型装进手机,智能终端演进的新方向。AI手机指的是 ...

观点 26 2024-03-19
铭基高科冲刺创业板,业绩存在波动,依赖前五大客户

铭基高科冲刺创业板,业绩存在波动,依赖前五大客户

聚焦精密连接组件领域 近期,广东铭基高科电子股份有限公司(以下简称“铭基高科”)更新了首次公开发行股票并在创业板上市招股说明书申报稿,保荐人为国信证券股份有限公司。格隆汇了解到,铭基高科致力于精密连接组件研发、生产、销售。截至招股说明 ...

观点 25 2024-03-19
全球手机厂商“新革命”打响,AI手机成角逐新赛场,谁在奋力鏖战?

全球手机厂商“新革命”打响,AI手机成角逐新赛场,谁在奋力鏖战?

再不布局就没戏了 AI 的风又吹到了手机行业。近两日,在苹果、高通等巨头新动作影响下,AI手机概念成为资本市场“新宠儿”。截止午盘,福蓉科技封涨停板,水晶光电涨超4%,中科创达、思泉新材、江波龙等跟涨。全球手机厂商“新革命”这将是一次划时代的 ...

观点 26 2024-03-19
“二师兄”身价回升,猪肉股“起飞”了!业内普遍预期谨慎,“猪周期”拐点何时显现?

“二师兄”身价回升,猪肉股“起飞”了!业内普遍预期谨慎,“猪周期”拐点何时显现?

短期难以持续走强 3月19日,猪肉板块震荡拉升,截至午盘,湘佳股份涨停,傲农生物涨超9%,神农集团涨超8%,华统股份、巨星农牧涨超6%,新五丰、牧原股份、唐人神、金新农、温氏股份等纷纷跟涨。消息上,生猪期货近期大涨,触及三个月高点。此外,农 ...

观点 28 2024-03-19
为什么行情会轮动成电风扇?

为什么行情会轮动成电风扇?

一方面,投资者们有很强的阿尔法思维惯性;另一方面,市场的增量资金主要是无偏资金。

观点 17 2024-03-19
油价持续上攻!港股“三桶油”齐拉升,后市有望继续冲高?

油价持续上攻!港股“三桶油”齐拉升,后市有望继续冲高?

全球石油需求将在2024下半年达到历史新高。 3月19日,港股石油股走强,板块涨幅一度超过3%,随后有所回落。个股上,截止发稿,中国海洋石油、中国石油股份涨超1%,中国石油化工股份等跟涨。回顾来看,自今年1月底以来,港股石油股持续震荡上行,累计 ...

观点 18 2024-03-19
信达策略:季度普涨,年度主线关注周期&AI

信达策略:季度普涨,年度主线关注周期&AI

高频经济数据显示宏观经济运行结构分化较明显 核心结论2月以来,高频经济数据显示宏观经济运行结构分化较明显,房地产行业数据仍偏弱,经济预期边际改善不多。但伴随着流动性风险的缓解、利率下行带来长期配置资金的流入,以及自下而上的微观盈利反 ...

观点 16 2024-03-19
如何理解超预期的经济数据?

如何理解超预期的经济数据?

出口拉动工业增加值回升 主要观点1-2月经济数据亮眼,表现超预期。1-2月工业增加值累计同比增长7.0%,较去年12月提升0.2个百分点,两年复合增速为4.7%,较去年12月提升0.6个百分点。而1-2月服务业生产指数累计同比增长5.8%,两年复合增速为5.6%,较 ...

观点 16 2024-03-19