当地时间周二,谷歌年度重磅活动“I/O开发者大会”在美国加利福尼亚州山景城拉开帷幕。大会以“Innovation in the Open”(开放中的创新)为主题,聚焦展示谷歌最新技术成果、产品更新及未来发展方向。
会上,谷歌不仅带来一系列Gemini模型升级、通用AI助手、AI搜索等功能更新,还正式发布了最强视频生成AI模型Veo3和图像生成模型Imagen 4。此外,谷歌还推出AI全家桶会员服务 ——Google AI Ultra,该订阅服务定价为每月249.99美元。
大会发布了哪些内容?
在大会上,谷歌首席执行官桑达尔·皮查伊(Sundar Pichai) 率先给出一组亮眼数据,直观展现了其生成式人工智能(AI)模型Gemini的爆发式进化。他说:“去年这个时候,我们通过产品和API每月处理9.7万亿个令牌。现在,我们处理的令牌数量超过480万亿,是去年同期的50倍。”
此外,Gemini的用户数量也呈现爆发式增长。“超过700万开发人员正在使用Gemini进行开发,比去年同期增长了5倍,而VertexAI上的Gemini使用率增长了40倍。Gemini应用目前月活跃用户超过4亿。”皮查伊补充道。
Gemini 2.5更新升级
在大会上,谷歌带来Gemini 2.5系列的最新版本。据谷歌介绍,全新的2.5 Flash几乎在各个方面都更胜一筹,在推理、多模态、代码和长上下文等关键基准测试中均有提升。它在LMArena排行榜上仅次于2.5 Pro。此外,谷歌为2.5 Pro引入了名为 “深度思考” 的增强推理模式,进一步优化了用户体验。
目前,全新的2.5 Flash已在面向开发者的Google AI Studio、面向企业的Vertex AI,以及面向大众的Gemini应用中提供预览。预计在6月初,2.5 Flash将正式发布并投入实际应用。
全新AI搜索模式
搜索引擎方面,谷歌表示,全新的AI搜索模式将重塑搜索体验。凭借更先进的推理能力,用户可以在AI模式下提出更长、更复杂的查询。事实上,早期测试人员提出的查询长度是传统搜索长度的两到三倍,并且用户还可以通过后续问题进行更深入的探索。所有这些功能都可以在搜索的新标签页中直接使用。AI搜索模式将于周二在美国面向所有用户推出。
阿斯特拉计划(Project Astra)
此外,谷歌在大会上展示了通用AI助手Project Astra的最新功能。当用户提出修理自行车的帮助请求时,Astra会全程接管:自动查找自行车使用手册,打开对应的 PDF 文件,滚动到正确页面,并播放 YouTube 教程视频。
目前,谷歌尚未透露该功能的具体推出时间,但明确表示 Project Astra 仍在积极开发中。其最终目标是成为一款真正的通用AI助手。
水手计划(Project Mariner)
去年12月,谷歌发布了基于Gemini 2.0模型开发的AI代理项目Project Mariner。而在周二的大会上,谷歌进一步披露了该项目的最新进展:新增多任务处理功能,并引入 “教导与重复” 机制 —— 用户只需演示一次任务流程,系统即可学习生成类似任务的执行计划。
目前,谷歌正将代理功能引入Chrome、搜索和Gemini应用。以Gemini应用为例,其全新代理模式可协助用户完成多项任务。例如,用户在寻找公寓时,该模式可在Zillow等平台筛选符合条件的房源、调整筛选参数、通过MCP访问房源信息,甚至协助安排看房。Gemini应用的代理模式实验版本即将面向订阅用户推出。
最强视频生成AI模型Veo3
值得关注的是,谷歌宣布将推出最新视频生成模型Veo3和最新图像生成模型Imagen 4。这两款模型都将集成至Gemini应用程序中,为用户开拓全新的创意空间。
最新的视频生成模型Veo 3不仅在Veo 2的质量上有所提升,而且首次实现了带音频的视频生成。它还可以产生城市交通的声音、公园里鸟儿的鸣叫声以及人物之间的对话声。
谷歌副总裁乔什·伍德沃德(Josh Woodward)表示:“我们正在进入一个融合音频和视频的创作新时代,这种创作方式非常逼真。”此外,谷歌面向电影制作人推出新工具Flow。通过该工具,创作者能够制作电影剪辑,并将短片拓展为更长的场景,助力影视创作。
个性化回复功能
谷歌介绍,在获得用户许可后,Gemini模型可在用户的Google应用中以私密、透明且完全可控的方式调用相关个人情境数据。以全新推出的Gmail个性化智能回复功能为例,当用户收到朋友询问过往自驾游建议的邮件时,Gemini会检索用户存储在Google云端硬盘中的邮件和文件(如 Google文档里的行程记录),并基于用户的具体情况生成回复建议。该功能通过匹配用户常用问候语、捕捉语气风格及习惯用词,确保回复更贴合用户的个人表达特点。Gmail个性化智能回复功能计划于今年晚些时候向订阅用户推出。
更加个性化、主动性和功能更强大的Gemini应用
谷歌正在推进DeepResearch的个性化升级,允许用户上传自有文件,并计划与Google Drive和Gmail实现连接,以此强化其自定义研究报告的生成能力。此外,DeepResearch还将与Canvas集成,用户通过简单操作,即可快速创建多语言动态信息图、测验,甚至生成播客内容。同时,Canvas中Vibe编码的应用发展态势良好,使得用户仅需与Gemini对话,就能构建功能性应用程序。
针对颇受用户欢迎的Gemini Live功能,谷歌将面向所有用户(含iOS用户)免费开放相机和屏幕共享功能,并计划将其与用户常用的Google应用进行连接,为用户带来更流畅便捷的使用体验。
谷歌光束(Google Beam)
谷歌介绍,Beam是一款结合了AI、多摄像头阵列和3D显示技术的视频会议设备。它采用先进的视频模型,将2D视频流转换为逼真的3D体验,利用六个摄像头阵列和人工智能将视频流合并,并在3D光场显示屏上呈现。它具备毫米级精度、60帧/秒实时头部跟踪能力,带来更自然沉浸的对话体验。首批Google Beam设备将于今年晚些时候面向早期客户上市。
Android XR眼镜
在主题演讲的尾声,谷歌推出了搭载AI技术的Android XR眼镜。这款眼镜将运行谷歌全新的 Android XR操作系统,配备可选的镜头内显示屏,能为用户提供短信、逐向导航、拍照以及实时翻译等功能。
谷歌表示,目前正与合作公司携手,助力他们在今年晚些时候启动眼镜的制造工作。同时,谷歌也将与测试人员协作,收集关于该眼镜实用性和隐私性方面的反馈。
谷歌还与三星和高通(QCOM)合作开发三星的Project Moohan,该项目计划于今年晚些时候上市销售。
AI会员订阅计划Google AI Ultra
此外,谷歌推出全新AI订阅计划Google AI Ultra,该计划提供最高使用限额,并可访问谷歌最强大的模型及高级功能,包含Gemini、Flow、30TB存储空间等。Google AI Ultra现已在美国上市,定价为每月249.99美元(首次用户可享前三个月五折优惠),后续将很快在更多国家和地区推出。
在大会上,皮查伊表示,人工智能的机遇确实巨大无比。而这波开发者、技术构建者和问题解决者将肩负起确保其惠及尽可能多的人的重任。
他还提到,当前开展的各项研究意义深远,将为未来在机器人技术、量子技术、AlphaFold 以及Waymo等领域的发展奠定坚实基础。
主题测试文章,只做测试使用。发布者:北方经济网,转转请注明出处:https://www.hujinzicha.net/23898.html