谷歌拍了拍Figure说,“起来卷”

谷歌拍了拍Figure说,“起来卷”

出品|虎嗅科技组

作者|余杨

编辑|苗正卿

头图|视觉中国

6月28日消息,在谷歌的最新播客中,机器人在Gemini人工智能技术的加持下,未经教授就完成了一次“扣篮”动作,展现出迅速适应新场景的能力。

两天前的洛杉矶,运行着Gemini Robotics On-Device 模型的机器人还在RSS2025(机器人软件与系统大会)上完成了全球首个互动式现场展示。硅谷AI观察人士Ted Xiao表示,“它仿佛是对未来的神奇一瞥——只需与你的机器人对话,它就会做出适当的回应,并尝试执行一些合理的操作。新的物体、新的命令、新的技能。”

谷歌拍了拍Figure说,“起来卷”

谷歌Gemini Robotics On-Device 模型发布于6月24日,AI 被引入了机器人,在整个过程中不需要持续的互联网连接,机器人实现了脱机工作。

谷歌在X上表示,这是自己首个“视觉-语言-动作”模型,旨在能够帮助机器人更快、更高效地适应新任务和新环境。如果我们稍加回忆,今年2月底,Figure发布的“历史上最重大的人工智能更新”——Helix也是一款用于通用人形机器人控制的“视觉-语言-动作”(VLA)模型。

不同的是,由于谷歌家的这款模型独立于数据网络运行,它对延迟敏感的应用程序很有帮助,并确保了间歇性或零连接环境中的稳健性。

谷歌拍了拍Figure说,“起来卷”

事实上,早在今年3月,谷歌就推出了第一代VLA(视觉语言动作)模型Gemini Robotics,将Gemini 2.0的多模态推理和现实世界理解带入物理世界。

而作为双臂机器人的基础模型的新选手Gemini Robotics On-Device ,除了最大限度减少计算资源需求之外,主要解决3个问题:灵巧操作、新任务的微调和适应、基于本地运行的低延迟快速推理。

谷歌拍了拍Figure说,“起来卷”

官方演示视频中,这一对灵巧手不仅可以拿起一支笔,还可以相互配合拔掉笔盖。

谷歌拍了拍Figure说,“起来卷”

在接下来的测试中,这一对灵巧手完成了“放置蓝色的砖块”、“拉开中间的抽屉”和“归位‘梨’模型”的任务,显示出强大的视觉、语义和行为泛化能力,并且仅仅依赖自然语言指令——“Can you close the middle drawer”?

演示之外,基础跑分数据上,Gemini Robotics On-Device也有不俗的表现。

首先是泛化能力,谷歌直接拉出了“当家花旦”——旗舰 Gemini Robotics 模型和 Previous Best On-Device模型进行比拼。结果上,Gemini Robotics On-Device虽然略低于旗舰产品的表现,但也超出之前最好的离线模型一大截。

谷歌拍了拍Figure说,“起来卷”

而在分布式任务和复杂的多步骤指令方面,Gemini Robotics On-Device 模型的表现也优于其他设备端替代方案。

谷歌拍了拍Figure说,“起来卷”

早在2月Figure的相关文章中就曾提到,“与受控的工业环境不同,家里堆满了无数的物品——精致的玻璃器皿、皱巴巴的衣服、散落的玩具——每件物品都有不可预测的形状、大小、颜色和纹理。为了让机器人在家庭中发挥作用,它们需要能够按需产生智能的新行为,尤其是对它们从未见过的物体。”机器人技术上的一大难题在于,举一反一简单,举一反三并不容易。

如何处理在训练样本中从未见过的任务,直接反映了机器人对新任务的适应能力。Figure家的Helix 给出的解法是使用一组神经网络权重来学习所有行为,建立了两个可以通信的“系统 1、系统 2”来分别完成“想”和“干”,而无需任何针对特定任务的微调。

而Gemini Robotics On-Device 给开发者提供了微调的选择,通过50 到 100 次演示即可快速适应新任务。微调任务的跑分如下:

谷歌拍了拍Figure说,“起来卷”

在喂了Gemini Robotics On-Device 100个以内的示例之后,它展现出了如上图所示的适应能力。

谷歌还公布了这一性能的演示,并将其进一步调整到了双臂Franka FR3 机器人和Apptronik 的Apollo 人形机器人中。

在双臂 Franka 上,该模型执行通用指令,可以处理以前未见过的物体和场景、完成折叠衣服等灵巧的任务,包括需要精确度和灵巧性的工业皮带组装任务。

谷歌拍了拍Figure说,“起来卷”

在阿波罗人形机器人上同样如此,通用模型可以遵循自然语言指令,以通用的方式操控不同的物体,包括之前从未见过的物体。

谷歌拍了拍Figure说,“起来卷”

对此,有网友认为,谷歌的脱机AI机器人存在改变游戏规则的可能性。

谷歌拍了拍Figure说,“起来卷”

当然,也有网友并不买账。提问这和特斯拉机器人的设计有什么不同,又和ylecun在Meta所做的工作有什么不一样。

谷歌拍了拍Figure说,“起来卷”

谷歌拍了拍Figure说,“起来卷”

在机器人/具身智能这个赛道,各家大模型正在“八仙过海”,技术向度展现出了多样性和丰富性,但最终指向了同一个命题——如何让AI在三维物理世界建立真正的因果认知。

或许正如谷歌在技术白皮书中所写:“机器人不应是人类的模仿者,而应成为物理世界的解读者”。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com

本文来自虎嗅,原文链接:https://www.huxiu.com/article/4517311.html?f=wyxwapp

主题测试文章,只做测试使用。发布者:北方经济网,转转请注明出处:https://www.hujinzicha.net/32671.html

(0)
北方经济网的头像北方经济网
上一篇 2025年6月29日 上午10:15
下一篇 2025年6月29日 上午10:16

相关推荐

  • 出口大涨30.6%,广州外贸爆火!

    01 广州出口暴涨30.6% 看最近广交会的爆火,就能知道广州的外贸稳了。 不久前,第137届春季广交会开幕。美国加征关税后,很多人第一直觉是外商采购肯定会比以前少了! 但是万万没想到的是这一届广交会的人流量和订单竟然双双爆了!据广交会的统计数据,广交会首日境外采购商累计线下参会64530人。 境外采购商同比增长8.9%,到会人数创下历史同期新高! 现场很多…

    财经 2025年4月28日
    8300
  • 为什么最会吃的中国人,没有世界级的零食?

    题图|视觉中国 中国人到底有多会吃?从调理刁钻食材的能力便可见一斑。 禽畜类的脚爪富含角质蛋白,未经处理口感韧硬,多数国家的人都对其束手无策。但落到中国厨子手中,猪牛羊、鸡鸭鹅的脚爪却能成为一席囊括猪脚姜醋、葱烧蹄筋、糊辣羊蹄、虎皮凤爪、芥末鸭掌和鲍汁扣鹅掌在内的盛宴,不仅给你料理得明明白白,而且原产地和味型绝不带重样。 在现代食品工业的加持下,不少料理从正…

    2025年3月26日
    5300
  • 中国城市AI大战,北京才出一栋楼就赢了

      有义务也有实力做些不一样的事。   文 | 华商韬略 刘柏铖   DeepSeek之后,中国AI加速。   国内一、二线城市们的焦虑也进一步加深。   但北京,有些不一样。   【AI,离不开北京】   北京似乎不担心“会不会错过DeepSeek”,因为DeepSeek更担心自己错过北京。   尤其是错过这里的人。   先后爆火的DeepSeek和Man…

    财经 2025年3月26日
    9700
  • GSK膨胀的ADC野望

    本文来自微信公众号:氨基观察,作者:武月 GSK贡献了一个医药行业创新逻辑的经典案例: 失败未必是终点,而是调整方向的契机。 2022年11月,GSK的BCMA-ADC Blenrep因确证性III期试验失败,黯然退市。 仅仅两年半的时间,Blenrep便借助联合疗法头对头战胜标准三联疗法的成绩,卷土重来——2025年4月18日,英国药监局(MHRA)批准其…

    财经 2025年5月1日
    6700
  • 集体承诺60天,车市打响反内卷第一枪?

    斑马消费 范建 童心未泯的郭川,在儿童节当天许下的心愿,正逐渐变为现实。 今年6月1日,汽车零部件企业孔辉科技董事长郭川,写下《我有一个梦想》。希望当今中国汽车产业上下游,能够和谐共处,共同促进产业真正高质量发展。 从6月10日晚间到11日,中国主流整车企业相继承诺,将对供应商的付款周期缩短至60天以内,以保障产业供应链的稳定。 中国汽车产业喊了许久的“反内…

    财经 2025年6月12日
    3100

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信