阿里千问3登顶全球最强开源模型 性能与成本双重突破

阿里巴巴于4月29日凌晨开源了新一代通义千问模型Qwen3,简称千问3。该模型参数量仅为DeepSeek-R1的三分之一,成本显著降低,性能却全面超越R1、OpenAI-o1等全球顶尖模型,成为目前最强的开源模型之一。千问3是国内首个“混合推理模型”,能够将快速和深度思考集成到同一模型中,对简单需求可以迅速给出答案,而面对复杂问题时则能进行多步骤深入分析,从而大大节省了算力消耗。

千问3采用了混合专家(MoE)架构,总参数量为235B,激活仅需22B。其预训练数据量达到36T,并在后训练阶段经过多轮强化学习,实现了非思考模式与思考模式之间的无缝整合。千问3在多个方面表现出色,包括推理能力、指令遵循、工具调用以及多语言支持等,均达到了国产及全球开源模型的新高度。例如,在AIME25奥数水平测试中,千问3获得了81.5分的成绩,刷新了开源记录;在LiveCodeBench代码能力评测中,得分超过70分,甚至超过了Grok3的表现;而在ArenaHard的人类偏好对齐评估中,以95.6分超越了OpenAI-o1及DeepSeek-R1。值得注意的是,尽管性能大幅提升,但千问3的部署成本却大幅下降,只需4张H20即可完成满血版部署,显存占用仅为性能相近模型的三分之一。

主题测试文章,只做测试使用。发布者:北方经济网,转转请注明出处:https://www.hujinzicha.net/18343.html

(0)
北方经济网的头像北方经济网
上一篇 2025年4月29日
下一篇 2025年4月29日

相关推荐

  • 3万粉丝直播间999元跟团游发货是风景照片

    近日,云南一网友在一近3万粉丝的直播间花999元下单跟团游,宣传全国80条线路任选,无任何隐形消费和强制购物。但付款后发现,链接名称竟为“风景照片”,收到货的仅有合同和旅游小册子。随后,直播间下架了店铺橱窗内的所有商品。据查,该商家营业执照的企业名称竟然是“百货店”。很多网友称自己也遇到过类似的直播间套路。

    2025年4月28日
    8900
  • 高明隐瞒自己中毒只为让藏海能安心离去…..

    藏海被高明师父救下,转身将其送出京城。毒发吐血的高明面对担忧的藏海,解释到一切都是骗过官差的计谋,而这全然只为让藏海能安心离去…..

    2025年6月9日
    7400
  • 为何美国消费者蜂拥到中国扫货 免税购物与退税政策吸引

    美国政府不断升级的贸易战正在催生一个意想不到的红火生意:中国旅游业。越来越多的美国消费者发现,与其在美国支付高昂价格,不如前往中国享受免税购物和假期。 中国实施了两项政策推动这一趋势。一是将免签证过境时长从144小时延长到240小时,使美国人可以将短暂的中途停留变为在北京、上海、广州等大城市的全方位购物狂欢。二是推出“即买即退”离境退税措施,让外国游客在购物…

    生活 2025年4月21日
    13000
  • 货车意外侧翻消防破窗救援 20分钟成功救出被困者

    货车意外侧翻消防破窗救援!5月6日,玉屏侗族自治县平溪街道发生一起货车侧翻事故。一辆满载砂石的货车在卸货时侧翻,驾驶员被困在驾驶室内。消防员接到报警后迅速赶到现场,利用破拆工具拆除车窗,扩大救援空间。经过20分钟的努力,成功将被困人员救出,并将其移交给现场医护人员。

    2025年5月9日
    10000
  • 8岁外甥女婚礼献舞送祝福萌翻全场,网友:我也想生个这么可爱的闺女!

    近日,山东临沂一场婚礼上,一位8岁外甥女的精彩表现成为全场焦点。在舅舅舅妈的婚礼现场,她自信大方地翩翩起舞,用活泼可爱的舞姿送上真挚祝福。全程她毫不怯场,灵动的表演萌化了现场观众的心。从舅妈采访中得知,她对这份特别的礼物满心自豪与欢喜。现场观众纷纷被小女孩的出色表现感染,不少人感叹也想生个如此可爱的闺女。

    2025年4月16日
    11400

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信