Google 在 2025 年 05月20日 I/O 大会上发布的主要产品和功能,涵盖了 AI 模型、开发者工具、搜索体验、硬件设备以及生产力工具等多个领域,可谓是干货满满。以下为全部产品:
一,Gemini 系列模型与应用升级
1,Gemini 2.5 Pro (含 Deep Think 模式):
功能/场景:这是 Gemini 系列的最新、最智能的模型,在 LMArena 排行榜上所有类别均处于领先地位。新的 Deep Think 模式是为 2.5 Pro 模型提供的实验性增强推理模式,旨在提供更深入的思考和分析能力。
应用:驱动更强大的 AI 搜索、更复杂的任务处理、以及更高级的创意生成。
2,Gemini Live:
功能/场景:将 Project Astra 的功能融入其中,允许用户通过手机摄像头和屏幕共享与 Gemini 进行实时互动。Gemini 可以利用摄像头捕捉到的信息(例如,识别咖啡店名称、回答关于屏幕内容的疑问)来提供帮助。
应用:Android 和 iOS 用户均可免费使用,适用于求职面试、培训计划、日常问答等需要视觉信息辅助的场景。
3,Gemini 应用个性化与新功能:
功能/场景:Gemini 应用变得更加个性化、主动和强大,新增了 Veo 3、Imagen 4、Deep Research 和 Canvas 等功能。
应用:提升用户在创作、研究和日常使用中的 AI 体验。
4,Gemini for Workspace 新功能:
功能/场景:在 Gmail 中推出个性化的智能回复,这些回复会基于用户的所有 Google 数据进行优化。还包括“收件箱清理”功能,用户可以通过自然语言提示让 Gemini 批量删除符合特定条件的电子邮件。
应用:提高工作效率,简化邮件管理。
5,Gemini Code Assist Standard & Enterprise:
功能/场景:免费的 AI 编码助手和代码审查代理,现已普遍面向所有开发者提供。由 Gemini 2.5 提供支持,并将拥有 200 万 token 的上下文窗口。
应用:帮助开发者更快地编写高质量代码,进行代码审查,并加速开发流程。
二,搜索与 AI Mode
1,AI Mode (AI 模式):
功能/场景:Google Search 的未来,集成了最新的 Gemini 模型,旨在提供超越信息获取的智能服务。AI Mode 能够生成定制图表和图形,处理后续问题,并提供“深度搜索”模式进行长期研究项目。
应用:提升搜索体验,提供更智能、更全面的答案,并支持复杂的查询和研究任务。
2,AI 购物功能 (“Try it on” 和 “Buy for me”):
功能/场景:
(1),“Try it on” (虚拟试穿):利用 AI 和用户的个人照片,让用户虚拟试穿衣服,减少退货。
(2),“Buy for me” (代我购买):在 AI Mode 中,用户可以跟踪商品的实时价格,并设置期望的购买价格。当商品达到设定价格时,AI 会使用 Google Pay 自动完成购买。
应用:革新在线购物体验,提供更便捷、更个性化的购物方式。
三,生成式媒体工具
1,Imagen 4:
功能/场景:Google 最先进的图像生成模型,改进了文本和视觉渲染,并在拼写和排版准确性方面有显著提升。
应用:为 Gemini 应用用户和 Vertex AI 企业用户提供更高质量的图像生成能力。
2,Veo 3:
功能/场景:最新的视频生成模型,能够生成带有声音的视频,对物理世界有更深的理解,并能控制摄像机运动和视角。
应用:为视频创作者提供强大的 AI 工具,支持制作高质量的视频内容,并可在 Google AI Ultra 订阅服务中和 Flow 应用中使用。
3,Flow:
功能/场景:一款新的 AI 电影制作工具,旨在帮助创作者进行下一波的故事讲述。它可以根据自然语言提示创建场景、角色和其他电影资产,并包含编辑和扩展现有镜头的选项,以及将 Veo 生成内容融入项目的功能。
应用:面向电影制作人、内容创作者,简化电影制作流程,提高创作效率。
四,创新硬件与平台
1,Google Beam (前称 Project Starline):
功能/场景:AI 驱动的新型视频平台,通过使用六个摄像头和 AI 将 2D 视频转换为 3D,以高精度跟踪头部运动,并以 60 帧每秒运行。
应用:旨在提供更逼真的 3D 视频通话体验,让远程会议感觉就像身处同一房间。将与 HP 合作提供给早期客户。
2,Android XR:
功能/场景:Google 为智能可穿戴设备推出的 XR (扩展现实) 平台。Google 正与 Warby Parker 和 Gentle Monster 等眼镜品牌合作开发搭载 Android XR 的眼镜。
应用:为下一代智能眼镜和混合现实设备提供操作系统和开发生态,带来沉浸式体验。
3,新一代 AI 芯片 (TPU Ironwood):
功能/场景:专为 AI 任务设计,比上一代 TPU 强大 10 倍,每 pod 可进行 42.5 exaflops 的计算。
应用:使得 Gemini 模型更快、成本更低,推动 AI 性能的极限。
五,其他重要 AI 功能与开发者工具
1,Google Meet 实时翻译 (带语音匹配):
功能/场景:Google Meet 将支持实时翻译,并能复制说话者的声音、语调和面部表情。
应用:提升跨语言交流的体验,初期支持英语和西班牙语,面向 Google AI Pro 和 Ultra 用户。
2,Project Mariner:
功能/场景:一种基于浏览器的代理式 AI,能够同时处理多达 10 项不同任务,从预订航班到研究再到购物。
应用:为 Google AI Ultra 订阅用户提供,实现更高效的自动化任务处理。
3,Google AI Ultra 订阅服务:
功能/场景:Google 的新 AI 订阅服务,每月 250 美元。提供 Google AI Pro 的所有功能,以及最高限额的 AI 模型访问权限,包括 Gemini 2.5 Pro Deep Think、Veo 3、Project Mariner、YouTube Premium 和 30TB 云存储。
应用:面向需要最强大 AI 能力和高级功能的用户。
4,Chrome 浏览器新功能:
功能/场景:
(1),将 Gemini 直接集成到 Chrome 浏览器中。
(2),Chrome 可以代表用户自动更新旧密码。
(3),内置 AI API (基于 Gemini Nano),包括 Summarizer API、Language Detector API、Translator API 和 Prompt API for Chrome Extensions,实现设备端 AI 处理,提高隐私、降低延迟和成本。
应用:提升浏览器内的 AI 体验和安全性。
5,Android Studio 开发工具升级:
功能/场景:
(1),Journeys for Android Studio:通过自然语言描述用户旅程,Gemini 即可自动执行测试,减少手动测试时间。
(2),Crash 修复建议:App Quality Insights 面板现在可以分析应用崩溃的源代码,提供全面分析和解释,甚至在某些情况下提供源代码修复建议。
应用:帮助 Android 开发者更快地测试应用、发现并修复错误,提高开发效率。
6,Colab 升级:
功能/场景:Colab 将成为一个完全代理式的体验。用户只需告诉 Colab 想要实现的目标,它就能在 notebook 中采取行动,修复错误并转换代码。
应用:加速数据科学和机器学习开发,降低用户操作负担。
7,Firebase Studio:
功能/场景:基于云的 AI 工作空间,帮助开发者将想法转化为全栈 AI 应用。开发者可以使用 builder.io 插件在 Firebase Studio 中实现 Figma 设计,并能检测应用何时需要后端并自动配置。
应用:简化 AI 应用的开发流程,提供一站式解决方案。
8,Jules:
功能/场景:一个异步编码代理,能够处理积压的 bug、同时处理多项任务,甚至初步构建新功能。Jules 直接与 GitHub 协作,并在用户准备好后创建 PR。
应用:帮助开发者处理重复性任务,让他们专注于核心编码工作。
9,SignGemma:
功能/场景:一个手语理解模型,将于今年晚些时候加入 Gemma 系列。它是目前将手语(主要针对美国手语)翻译成口语文本功能最强大的模型。
应用:为听障用户提供新的技术访问方式,提升无障碍体验。
总结:
Google已经从一个AI跟随者,转变成了一个AI引领者,Google还是那个Google,还是那个技术雄厚的Google,还是那个技术引领者。
Google I/O 2025 充分展示了 Google 在 AI 领域的领导地位和雄心,通过多维度、多层次的产品和功能创新,致力于将 AI 融入到人们的日常生活中,并为开发者提供更强大的 AI 赋能工具。
最后:
引用,原文:
https://io.google/2025/