刚刚,Google DeepMind 发布了 Gemini 2.5 Pro 的最新更新版本:Gemini 2.5 Pro (I/O edition)。
其最大的进步是编程能力大幅提升,不仅在 LMArena 编程排行榜上名列第一,同时也在 WebDev Arena 排行榜上更是以显著优势超过了昔日霸主 Claude 3.7 Sonnet (20250219)!
不仅如此,现在用户只需使用一个提示词即可构建 Web 应用、游戏和模拟程序等,甚至用户仅需提供一张手绘草图 + 功能描述,就能得到一个带有自己设计的 UI 的功能完备的应用。
此外,下面的视频还展示了 Gemini 2.5 Pro (I/O edition) 的另一项能力,可以根据自然图像生成代码,而这些代码可以动态表示自然图像中内容。
自家模型更新,谷歌的多位大佬也纷纷出来站台。
诺贝尔奖得主、DeepMind CEO Demis Hassabis 表示 Gemini 2.5 Pro (I/O edition) 已经在 Gemini APP、Vertex AI 和 Google AI Studio 中开放,并且其尤其擅长构建交互式 Web 应用,下面的演示展示了该模型根据草图构建应用的能力。
可以看到,只需一张描述画板应用的简单草图加上一句简单的提示词,Gemini 2.5 Pro (I/O edition) 就创建出了一个功能完备的 Web 应用。
另外,谷歌母公司 Alphabet CEO、Google AI 负责人 Jeff Dean 也都各自发布了宣传推文。
谷歌博客表示,他们原计划在几周后的 Google I/O 大会上发布 Gemini 2.5 Pro Preview (I/O edition),「但由于大家对这一模型的热情高涨,我们希望尽快将其交付到大家手中,以便人们能够立即开始构建。」
「Gemini 2.5 Pro 的编程和多模态推理功能获得了广泛好评,此次更新正是基于此。除了专注于 UI 的开发之外,这些提升还扩展到了其他编程任务,例如代码转换、代码编辑和开发复杂的智能体工作流。」
这些增强能力让 Gemini 2.5 Pro 在 WebDev Arena 中的 Elo 分数大幅提升:比上一版本高出 147 分!WebDev Arena 排行榜衡量的是人类对模型构建美观且功能强大的 Web 应用能力的偏好。