|
美国当地时间6月2日,微软Build 2026开发者大会在旧金山梅森堡拉开帷幕。此次大会主题聚焦于前沿AI技术的实战应用,微软发布了一系列覆盖自研AI模型、智能体应用、操作系统安全、开发者工具、云服务及新型硬件平台的产品与更新。
在2025年的开发者大会,微软确立了“AI智能体时代”方向,发布了Copilot Studio多智能体编排、Windows AI Foundry,并宣布全面支持Model Context Protocol,GitHub Copilot 推出编程智能体 Coding Agent。
在微软的叙事中,2025年解决的是“智能体时代,该用什么标准和框架”,2026年聚焦的是“如何用自家的模型和产品,真正跑起来”——模型层补上了能挑大梁的自研主力,产品层把智能体从演示推向了系统、硬件和云的全栈落地。
这次发布会,核心发布可分为六个板块:MAI自研模型家族、以Scout和GitHub Copilot应用为代表的智能体生态、Windows系统级AI安全沙箱MXC、面向开发者的Surface RTX Spark Dev Box与系统优化、Project Solara新型智能体设备平台,以及包括Microsoft IQ、Rayfin、ASSERT、ACS等在内的开发者工具与治理框架。
整场主题演讲以微软CEO萨提亚·纳德拉的愿景陈述为主线徐徐展开。他抛出“智能体优先”的战略框架后,各业务线高管依次登台,推出具体产品把这套框架落到实处。
在大会上,苏莱曼宣布推出七款由微软AI内部开发的全新模型,统一归入MAI家族。
他将MAI的使命描述为构建一台“爬山机器”,通过持续投入计算量、更优数据和更精准评估,实现循环往复的自我改进,让用户始终保持在技术前沿。
训练计算规模方面,苏莱曼指出,用于训练前沿模型的计算量已增长一万亿倍,预计未来三年内还将再增长一千倍。微软所有MAI模型均“从零开始进行爬山,零蒸馏”,不依赖第三方模型输出进行训练。
具体模型如下:
旗舰推理模型MAI-Thinking-1,这是一个中型模型。微软表示,它在关键的软件工程测试中,性能可以跟市面上最好的模型打平。在盲测对比中,人类评判员对它的偏好程度跟Sonnet 4.6不相上下。这个模型是从零开始、用干净数据训练,未使用第三方模型蒸馏。
编程模型MAI-Code-1-Flash,是一个推理高效的agentic编码模型,拥有50亿参数,专为GitHub Copilot、VS Code和微软技术栈量身定制并深度集成。微软表示其可与Haiku媲美但成本更低。
文生图模型MAI-Image-2.5及其超高效Flash变体,支持文生图和图像编辑,微软称其在Arena评分上超越了谷歌Nano Banana Pro。
转录模型MAI-Transcribe-1.5,具备SOTA级别准确性。据称速度比竞品模型快五倍,内置支持43种语言的领域特定术语识别。
语音生成模型MAI-Voice-2,提供高质量、自然听感的语音生成,支持15种语言,能够根据短样本适配声音,具备防滥用保护措施。其Flash变体即将推出,以更低成本实现同样功能。
所有模型共享相同的数据规范、基础设施和评估框架。除了在Azure Foundry上分发并为微软第一方产品优化外,这些模型还将在Open Router以及Fireworks和Baseten上向开发者提供。开发者首次能够自行调整模型权重。
|