据WccfTech报道,苹果是垂直集成的爱好者,倾向于尽可能保留关键技术节点在内部,其庞大的定制芯片设计项目或许是这一范式的最佳例证。
今年年初,已经有多家媒体报道称苹果正在与博通合作开发Baltra,新芯片将采用台积电3nm工艺,并将于2026年进入量产阶段。WccfTech的最新消息是,这类定制化AI芯片的实际部署时间目前预计在2027年,而苹果早在今年10月就已开始出货其美国本土制造的服务器。
真正的问题在于:苹果将如何运用其定制化AI芯片?这将决定Baltra芯片的整体设计与架构走向。
苹果预计不会自己训练大模型,而是选择与谷歌达成协议。上个月初,据知名记者马克·古尔曼报道,苹果已经放弃打造内部大模型,将每年支付约10亿美元,使用谷歌定制的1.2万亿参数Gemini模型以驱动苹果智能工作。
基于此,WccfTech推测,苹果主要会使用Baltra来满足其庞大的AI推理需求。
推理芯片的架构与用于训练模型的芯片架构不同,前者更注重时延与吞吐量的优化,同时还采用了基于低精度运算的架构设计,例如INT8精度。因此,这也可能是苹果和博通在推进Baltra整体设计流程时,会重点关注的方面。
科技博主Max Weinbach在社交平台X上发文称,他认为苹果大概率不会打造大规模的算力集群,反而可能会推出类似(英伟达)GB300架构的产品,采用64颗芯片互连,搭配更大容量的高带宽LPDDR内存。这种方案的成本应该会比目前市面上多数芯片低不少,同时又能精准匹配实际需求。
苹果去年3月提交了“基于光学的分布式统一内存系统”专利,或许暗示了苹果未来的发展方向。
该专利公开了若干与硅光子学计算系统相关的技术方案。在部分案例中,该计算系统包含多个计算芯片封装单元,其内置处理器可执行程序指令,对存储于分布式内存中的数据进行运算;上述分布式内存可通过统一内存架构实现访问。该计算系统还配备多个内存芯片封装单元,以搭建统一内存架构。具体而言,任一内存芯片封装单元均集成一组光接口与内存控制器,前者负责接收处理器发出的内存访问请求,后者则根据接收到的请求,完成对分布式内存对应分区的读写操作。
结语:苹果或借Baltra重塑AI竞争力
苹果通过自主研发AI服务器芯片,可以基于此优化其AI算法,以提升性能和能效。
此前,苹果在大模型领域数次受挫,被曝放弃大模型训练相关布局,这也使其在AI赛道的竞争力受到影响。此次被传计划于2027年落地部署的Baltra芯片,或对苹果提升产品AI性能,增强其在AI领域的竞争力有重大意义。