谷歌年度I/O开发者大会：AI加速！AI 可以更深入地思考、更聪明地购物并创建带有对话的视频

周二，谷歌在其年度 I/O 开发者大会上宣布了一系列全面的人工智能进步，引入了更强大的 AI 模型，扩展了其搜索功能，并推出了新的创意工具，突破了其技术所能完成的界限。

这家总部位于山景城的公司推出了 Gemini 2.5 增强功能，向所有美国用户推出了搜索中的 AI 模式，引入了新的生成媒体模型，并为高级用户推出了名为 Google AI Ultra 的每月 249.99 美元的高级订阅套餐——所有这些都反映了谷歌在其产品生态系统中加速的 AI 势头。

“每个人都可以获得更多情报，无处不在。世界正在做出回应，以前所未有的速度采用 AI，“谷歌和 Alphabet 首席执行官 Sundar Pichai 在会议前的新闻发布会上表示。“所有这些进步意味着我们正处于 AI 平台转变的新阶段，数十年的研究现在正在成为全世界人们、企业和社区的现实。”

增强的推理功能：Gemini 2.5 型号引入了革命性的“深度思考”功能

Google 公告的核心是其 Gemini 大型语言模型的持续发展，对 Pro 和 Flash 版本都有了重大改进。更新后的 Gemini 2.5 Flash 将于 6 月初正式上市，Pro 也将紧随其后。

最值得注意的是“深度思考”的引入，这是 Pro 模型的增强推理模式，谷歌声称通过使用并行思维技术在复杂任务上提供了突破性的性能。该公司表示，这种方法允许模型同时考虑多种可能性，类似于 AlphaGo 彻底改变游戏的方式。

“Deep Think 将模型性能推向极限，提供了突破性的结果，”Google DeepMind 首席执行官 Demis Hassabis 在新闻发布会上说。“它在 USAMO 2025 上获得了令人印象深刻的分数，这是最难的数学基准测试之一。它还在 LiveCodeBench 上领先，LiveCodeBench 是比赛级编码的基准测试。

该公司正在谨慎地推进 Deep Think，计划在更广泛发布之前首先将其提供给受信任的测试人员以获得反馈。这种慎重的方法反映了 Google 对负责任的 AI 部署的重视，尤其是对于突破 AI 可以完成的任务界限的前沿功能。

重新构想搜索：AI Mode 扩展了个性化和代理功能

谷歌正在将 AI 更深入地引入其核心搜索产品，向所有美国用户推出“AI 模式”，此前它**于 Labs 测试人员。这种替代搜索体验使用一种称为“查询扇出”的技术将问题分解为子主题并同时发出多个搜索，从而提供比传统搜索更全面的结果。

“AI Mode 是我们最强大的 AI 搜索，具有更高级的推理和多模态，并且能够更深入地了解后续问题和有用的网络链接，”副总裁兼 Google 搜索负责人 Liz Reid 说。

该公司揭示了围绕其现有 AI 概览功能的令人印象深刻的指标，该功能现已覆盖超过 15 亿用户。“在美国和印度等我们**的市场，AI 概览推动 Google 在显示 AI 概览的查询类型的使用量增加了 10% 以上，”Reid 在预览中指出。

AI 模式的新功能包括用于综合研究报告的深度搜索、用于实时视觉帮助的实时功能，以及可以整合用户 Google 帐户数据的个性化选项。这种个性化需要明确的用户选择加入，旨在通过了解个人偏好和上下文来提供更相关的结果。

虚拟试衣间：AI 试穿技术改变购物体验

谷歌正在大力推动人工智能驱动的购物体验，推出了一项虚拟试穿功能，让用户只需一张自己的照片就能看到衣服穿在身上的样子。该技术代表了使在线购物更加直观和个性化的重大进步。

“在这种情况下，我可能找到了五件我喜欢的衣服，我在网站和那里的模特身上看到了它的样子。但是，我看起来完全不像那些模型，我想知道哪一个真正适合我，“广告和商务副总裁兼总经理 Vidhya Srinivasan 解释道。

该系统由专为时尚应用设计的专用图像生成模型提供支持。据 Srinivasan 称，它“对 3D 形状”和面料有非常深入的理解，使其能够逼真地呈现服装在不同体型上的悬垂和贴合度。

除了视觉试戴之外，Google 还推出了代理结账功能，当商品达到用户指定的价格点时，该功能可以自动完成购买。此功能通过 Google Pay 处理整个结帐流程，展示了 Google 如何应用其代理 AI 功能来简化日常任务。

视听突破：生成式媒体随着Veo 3和Imagen 4的发展而发展

谷歌公布了对其生成媒体模型的重大升级，推出了用于视频生成的 Veo 3 和用于图像的 Imagen 4。最显着的进步是 Veo 3 能够生成具有同步音频的视频——包括环境声音、效果和角色对话。

“我们**次走出了视频生成的无声时代，”Hassabis 说。“Veo 3 不仅提供了更令人惊叹的视觉质量，而且还能产生声音效果、背景噪音甚至对话。”

这些高级模型为 Flow 提供支持，Flow 是 Google 专为创意专业人士设计的新 AI 电影制作工具。Flow 集成了 Google **的 AI 模型，帮助故事讲述者通过更直观的界面创建电影剪辑和场景。

“Flow 的灵感来自时间变慢、创作毫不费力、迭代且充满可能性的感觉，”公司声明称。该工具已经与几位电影制作人进行了测试，他们使用该技术与传统方法相结合创作了短片。

与此同时，Imagen 4 改进了图像质量，特别关注排版和文本渲染，使其在创建营销材料、演示文稿和其他结合视觉和文本的内容时特别有价值。

沉浸式通信：Google Beam 从 Starline 项目研究中演变而来

该公司宣布，其几年前首次展示的实验性 3D 视频通信技术 Starline 项目正在发展成为名为 Google Beam 的商业产品。这项技术创造了与某人在同一个房间里的感觉，即使在远程通信时也是如此。

“Google Beam 将成为一个新的 AI 优先视频通信平台，”皮查伊解释说。“Beam 使用一种新的***的 AI 视频模型，将视频流转换为逼真的 3D 体验。”

该系统采用一系列摄像头来捕捉参与者的不同角度，然后使用 AI 合并这些流，并通过精确的头部跟踪将它们渲染在 3D 光场显示器上。结果是超越传统视频通话的深度沉浸式对话体验。

Google 已与 HP 合作，将于今年晚些时候为特定客户推出首批 Google Beam 设备。该技术还引入了语音翻译功能，可以保持语音质量和表达能力，允许跨越语言障碍进行自然对话——这项功能也将出现在 Google Meet 中。

高级访问权限：新的 Ultra 订阅层面向高级用户和专业人士

为了通过其***的 AI 产品获利，谷歌推出了一个名为 Google AI Ultra 的高级订阅层，价格为每月 249.99 美元。此层级提供对 Google 功能最强大的模型的访问权限、最高的使用限制以及对实验性功能的早期访问。

“如果您是电影制作人、开发人员、创意专业人士，或者只是需要具有***别访问权限的 Google AI 的绝对**功能，那么 Google AI Ultra 计划就是为您打造的——将其视为您进入 Google AI 的 VIP 通行证，”该公司在其新闻材料中表示。

Ultra 计划包括使用带有音频生成的 Veo 3、Deep Think 模式（如果可用）、Flow 电影制作工具、Project Mariner 的代理功能和 30TB 的存储空间。它还与 YouTube Premium 捆绑在一起。

“考虑 Google AI Ultra 计划的方式是，它几乎就像您访问所有 Google AI 的 VIP 访问权限。所以这将是特殊功能，最高的速率限制。我们还在那里提供对产品和功能的早期访问，“Google Labs 和 Gemini 副总裁 Josh Woodward 解释道。

Google 每月 19.99 美元的标准 AI Pro 订阅将继续，Ultra 层的一些功能最终会成为这种更实惠的选择。

研究与现实的交汇点：Google 的 AI 愿景正在形成

Google 的 I/O 公告反映了一家处于转折点的公司，它成功地将其巨大的研究投资转化为可以重塑人们与技术互动方式的产品。对代理能力（可以代表用户采取行动的 AI）的强调标志着超越当前一代辅助 AI 的重大演变。

“我发现的神奇之处之一是搜索......人们只是凭直觉适应可能性的力量，“皮查伊评论道。“我认为人们最兴奋的是，当你让 [交互] 变得更加自然和直观时。”

对于权衡 AI 战略的企业和开发人员来说，Google 不断扩大的生态系统提供了强大的工具，但需要仔细考虑集成途径、成本和数据隐私影响。该公司在开发优质产品的同时将 AI 嵌入到核心产品中的双重方法表明，这是一项既要保护现有市场又要创造新收入来源的长期战略。

随着这些技术从实验室走向日常使用，它们突显了 Pichai 对当前 AI 时刻的观察：我们正在见证理论能力转变为实用工具，以应对人们自然工作、创造和交流的方式。构建真正有用的 AI 的竞赛不仅关乎技术能力，还关乎将智能带到我们最需要的时刻，其方式更像是使用技术，而更像是被技术理解。

更多AI前沿资讯、工具、实战，关注数字力公开课：

官方网站：www.addloo.com

视频号：数字力公开课

抖音号：数字力公开课

小程序：数字力公开课

AI前沿

下一篇：小米自研芯片Xring O1量产！雷军豪掷135亿，国产芯再进一步！

上一篇：当人工智能遇上电影院时，谷歌的Flow让Veo 3栩栩如生