通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索
查看: 862|回复: 2
打印

谷歌TPU调研纪要 [复制链接]

军衔等级:

  大校

注册:2016-3-7292
跳转到指定楼层
1#
发表于 2025-12-1 09:07:26 |只看该作者 |倒序浏览
梦想的第四维

问:谷歌TPU目前的情况如何?

答:谷歌目前总量没有变化,但结构发生了调整。现在490万颗是按照wafer-in的口径计算,即半成品进Waver bank,total可能达到490万颗。如果明年(2026年)CoWoS量充足,最多可以向Google供应490万颗,但目前来看实际可供量基本为420万颗。在这420万颗中,原有结构有所变化。V5仍为100万颗,未变。V6从200万颗调整至40万颗,变化较大。V7从90万颗提升至200万颗。V8e保持30万颗不变,V8p则增加至50万颗。新增的产能主要集中在V7p和V8p上。

主要原因是除了Google自身需求外,大客户租赁和采购的对象主要是V7P和V8P,因此Google大幅提升了这两款产品明年(2026年)的出货量。从供应商角度看,明年(2026年)鸿海将重新参与,已在今年(2025年)五六月份提出该计划。鸿海将以代工商和专业液冷解决方案提供商的双重身份,为Google打造定制化液冷解决方案,在v7开始。但该计划仍有变数,目前谷歌正在讨论将组装流程拆分。原本CLS、伟创力和鸿海三家均负责整机组装,现在讨论将整机拆分为L6模组(PCBA)和L11整柜两部分,分别由不同供应商负责。

该方案尚未最终确定,预计最晚在明年1月定案。如果采用第二种流程,CLS可能只负责L6,即原本整柜方案不再由CLS承担,L6约80%由CLS完成,约300多万颗,剩余20%可能由Jabil负责,但仍存在不确定性。鸿海和Flex则负责L11整柜集成,CLS提供主板后由他们完成集成,天弘则专注于主板生产,主板价值占比最大。若采用此方案,对天弘有利,但目前仍在讨论中。原始方案是三家分配420万颗,鸿海分100万颗V7P(约1.5万柜),CLS分80万颗V7P及70万颗V8P和V8E,Flex分约30万颗(20万颗V7P和10万颗V8)。新方案是否执行尚未确定,类似英伟达的做法,将系统和整机组装流程拆分,各方更专注,组装效率更高。

问:之前拆分时没有V8,现在V8是提前了吗?

答:一个月前没有V8P,现在V8P提前了。V8P原定后年2月,现在提前至明年(2026年)10月或11月,与V8E时间接近,两款产品将先后推出整柜。

问:V7的时间线是什么?

答:V7计划在明年(2026年)8月底至9月中旬进入量产。由于产量从90万颗提升至200万颗,工厂生产时间需提前,否则难以完成任务。

问:TPUV8与V7相比有哪些升级或变化?

答:V8芯片性能升级,包括HBM和浮点运算能力等均有提升。结构上,V8可能在柜内增加交换tray,16台server每一台Server都配备switchtray,实现计算与交换一体化。连接方式不是通过背板,而是超融合方案,即一台服务器盒子内同时包含计算板和交换板,也可能是并排两块板,后端通过线缆连接。每台服务器还配有独立CPU服务器,CPU不在主板上,而是由专门服务器支持。V7P和V6P均采用此部署方式。V8P硬件结构新增交换tray,预计每块主板大约有四到八个1.6T端口。但这个方案目前只是看到了草图,也许只是其中的一块板,但比较清楚的是增加了交换tray,把原来Tor交换机的位置挪掉,柜内通过交换tray的方式来提升端口密度。

问:V7服务器单柜内有64颗TPU芯片,V8也是如此吗?

答:64颗芯片数量未变,柜内ASIC数量保持不变,仅增加了新的组件。

问:谷歌计划改变供应商代工模式。如果按照现有模式,TPUV7和V8CLS负责的价值量是多少?若改为L6组装模式,价值量会有何变化?

答:目前整机组装不含芯片,占整柜BOM的30%,各家代工费不同。以V7为例,一柜64颗芯片、16台服务器,全部配齐约90万美元。芯片约58万美元,剩余32万美元为交换机、PCBA及其他部件。若按板子计算,板子相关价值占原32万美元的60%,其余40%为板外价值。改为L6组装后,板子至少80%由CLS负责,原本为65%。这样公司工作更简单,无需整套装配,且板上液冷仍由公司负责。板子加液冷约20万美元,液冷部件由CLS采购并组装,最终集成后交给其他供应商,目前仍在讨论。

问:32万美元不包含液冷价值,对吗?

答:不包含。液冷价值在柜内约占一半,每柜液冷约7万美元,其中3万在板上,剩余为柜外部件及CDU部分,按平均价值计算。

问:V8的价值量相比V7有何变化?

答:V8E价值量下降,V8P尚未定价。V8E与V6E价格接近,每柜约73万美元。

问:为什么V8E价值量下降?

答:V8E用于推理,推理芯片单价低于训练芯片,功耗也更低,性能不及训练芯片。此外,V8E芯片为Google自研,与联发科联合设计,自研成本低于委托生产,成本可控。V8E芯片核心由Google负责,联发科负责IO部分,两家共同开发。芯片功耗较原预期低15%-25%,因此整体价值量较低。

问:V8E芯片占多少价值,其余部分是多少?

答:V8E芯片单价约8000美元,一柜64颗即51万多美元,其余22万美元为柜体及LC等部件,不含液冷。液冷约5万美元每柜。

问:V8P价格目前有出来吗?

答:V8P刚进入EVT阶段,BOM未定,价格无法确定。

问:根据经验或目前掌握的信息,预计V8P的价值量是多少?

答:V8P芯片单价预计在1万美元左右

问:V8P服务器除了芯片,还多了交换板,对吗?

答:多了交换板的话,去掉两台套交换机大约可以节省约5万美元。交换板如果按照TH6计算,未必会完全采用TH6,因为单板只有约四颗芯片,因此很可能采用TH5来实现1.6T端口聚合。以1.6T为例,64个1.6T端口一块板根本无法全部承载。Google也在讨论另一种方案,即将交换功能集成在一起,这样可以提升单板的端口密度,用64端口进行集成。但这种方案不适合扩展。根据Google目前的设计,基本上会将交换单元集成在每个服务器内,每块单板可能是一块小型计算单元,共有16块计算单元。目前这些方案都处于EVT样品制阶段,预计会做两到三套方案的样品试制,测试后确定最终原型机,再确定对应的BOM价格。

问:大概什么时候会有结果?

答:时间线预计最快在1月份会有结果。

问:V8P的液冷方案现在确定了吗?相比V7会有哪些差别?

答:V8P液冷方案肯定会采用,功耗预计比V7高100到200瓦左右。目前传统液冷方案仍可使用,但Google可能会尝试部分采用浸没式液冷,为后续产品升级和规模化做准备。

问:浸没式液冷是由鸿海负责吗?

答:鸿海是液冷供应商之一,但不仅限于鸿海。只要参与该项目的厂商,都需要有对应的液冷解决方案。如果采用三家各自做整柜的方案,各自或其液冷供应商都需推出相应的浸没式液冷方案。鸿海只是在自己的产品线上采用自有方案,为Google提供一套完整的解决方案。

问:如果部分采用浸没式液冷,这部分的量大约占多大比例?

答:浸没式液冷的比例不会很高,预计不会超过30%。

问:如何评估明年(2026年)采用浸没式液冷方案的成熟度?

答:这不是成熟度的问题,而是行业趋势,属于必然的发展方向。

问:浸没式液冷在实际量产过程中会遇到哪些问题?

答:目前主要挑战在于tank的选材,包括物理属性和化学属性,仍在研发阶段。Google已对供应商提出相关要求。主要变化在tank设计,不会将整个柜子全部放tank,而是每个tank装一个server,通常有16个tank。

问:浸没式液冷相比传统液冷,价值提升多少?

答:至少提升30%。

问:如果只生产L6板子,与之前整机生产相比,毛利率会有什么变化?

答:如果只做板子并加入液冷,毛利率会比原来更高。唯一的差别是调整空间变小,因为所有BOM成本需向Google公开,至少70%的BOM需完全透明,Google会控制毛利率范围。所以从L11到L6,调整空间主要集中在主板上。Google基本会保证一定毛利率,相关费用需计入PCB成本,如物料的额外支付(PPV)。公司总体目标是将Google项目毛利率提升到8以上,实际可能在7.5到8之间。明年(2026年)希望达到7.5到8。

问:V7到V8的PCB板子有什么变化?

答:V8预计会采用M9材料,V7未使用。V8还会结合HDI技术,可能不止一种板型,预计会有三到四块不同的板子。有些采用M9,有些采用结合HDI的方式。HDI的话胜宏数量会较大,但一开始不会全部采用,预计初期HDI份额在30%到35%,其余继续使用高多层。现在计算板沪电建议的为44层,不同供应商有不同建议,主要供应商为TTM、胜宏和沪电。

问:有深南参与吗?

答:深南是第四家供应商,主要作为备份。如果其他供应商产能不足,会分部分订单给深南。沪电份额最大,在PCB生产中占比超过50%。

问:能否梳理一下TPUV7的PCB板方案?是高多层方案吗?V7的板子价值是多少?

答:TPUV7采用高多层方案,V7主板为38层,V8建议为44层。每块板子的价值均在2000美元以上。

问:V8可能有三到四块板子,能否展开讲讲?

答:每代产品通常有三到四块主板,虽然产品只叫一个名字(如V7、V8),但实际方案中包含多块PCB主板。每代至少有三种板型,分别调整CPU、HBM和端口数。例如V6最初用400G端口,后期升级为800G。V6还曾试验过256颗芯片一柜的方案,约占15%,该板型仅用于实验。V7也有类似高密度实验板,约占10%到15%,主要用于液冷一体化实验。每代产品会有子项目,部分量用于验证下一代更先进方案。

问:V8可能会采用HDI方案吗?

答:肯定会采用HDI方案。

问:HDI板全部由胜宏生产吗?

答:目前主要是V8P,预计50万颗中有一半采用HDI,由胜宏生产,另一半采用高多层,由沪电生产。试生产阶段会同时试验两种板型,分别测试散热、耐热和稳定性,之后再决定量产采用哪种方案。Google一直在动态调整,工厂中同时有多种板型,EVT流程下每代产品有四五个版本。最终量产采用最成熟、性价比最高的主板,其他板型则用于特定场景,量不会很大。

问:V8P目前HDI和高多层各占一半,这个比例是预计还是已确定?试生产时会不会只选一个板型量产?

答:试生产阶段会同时生产两种板型,否则无法赶上后年规模量产。只有同时生产,才能判断哪个版本更好,最终在量产前确定方案。

问:胜宏生产的HDI板是几阶?其价值量与高多层板相比如何?

答:目前还未确定是一阶、二阶还是三阶HDI,EVT阶段尚未出结果。HDI的价格肯定要高一些,但它的未来成长空间更大。在没有规模量产之前,HDI的成本会更高。采用HDI的目的并不只是考虑成本,更重要的是看重其技术潜力。现在的出货主要是为了验证技术的可行性和成熟度,并不是以商用为主要目标。当然,产品推出后也会实际使用,但主要是测试这套方案在技术上是否可行、是否成熟、是否适合大规模应用,以及技术和商务逻辑是否成立。

问:高多层版本沪电和TTM的份额情况大概是怎么样的?

答:高多层板市场份额大致是沪电占七成,TTM占三成。TTM可能存在产能不足的情况,如果产能不足,会有第四家进入,通常是深南。

问:V8展望后年的量,客户有forecast指引吗?

答:据了解,后年Google内部的预测是800万颗,但认为实际出货量达不到这个数字。2027年如果能出到650万颗给Google已经非常不错了。极限情况下可能达到700万颗,800万颗只是Google的目标,实际很难实现。

举报本楼

本帖有 2 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2025-12-2 07:49 , Processed in 0.148877 second(s), 16 queries , Gzip On.

Copyright © 1999-2025 C114 All Rights Reserved

Discuz Licensed

回顶部