通信人家园
标题:
明年发CPU和GPU新品!英特尔详解数据中心AI“全家福”
[查看完整版帖子]
[打印本页]
时间:
2025-11-22 13:39
作者:
ttxx
标题:
明年发CPU和GPU新品!英特尔详解数据中心AI“全家福”
芯东西(公众号:aichip001)
作者 ZeR0
编辑 漠影
芯东西11月20日报道,在2025英特尔技术创新与产业生态大会上,英特尔数据中心与人工智能集团副总裁、中国区总经理陈葆立发表主题,宣布英特尔将在
2026年
推出采用Intel 18A制程节点的英特尔
新一代至强6+处理器产品
,
下一代服务器GPU产品
将于
2026年下半年
正式发布。
陈葆立详细分享了英特尔在数据中心领域的新产品、新技术、新机遇,并晒出满足企业AI三层部署需求的英特尔AI“全家福”。
英特尔作为过去十几年来数据中心的核心技术提供商,通过跟客户的沟通交流,发现打造一个先进的技术中心需要多维考虑,除了性能更高之外,要考虑软件适配能力、可靠性、可用性,以及对于储存、IO各方面的综合平衡性。
基于多年积累的知识,英特尔打造了一个面对数据中心的完整产品方案,陆续发布了全新至强6全系列产品,致力于为中国客户与合作伙伴构建更强大、更灵活、可持续发展的技术基础设施。
数据中心处理器的一个主要工作,是保证数据能在数据中心快速传输。至强6在内存带宽和IO带宽上都有显著提升。今天,企业中广泛使用的32核至强6处理器,相比前一代拥有更强的算力和更快的内存性能,在多数企业业务中实现了超过20%的性能提升;在高内存带宽的数据库场景中,性能提升更是达到35%。
近几年,英特尔持续强化至强6在AI计算方面的能力:在AVX-512指令集基础上,进一步引入了专用的AMX矩阵加速引擎。以基于HNSWLib的近似近邻搜索为例,通过将查询向量合并为矩阵运算,利用至强6的AMX内置加速引擎,相比传统AVX-512指令,端到端性能提升超过72%。
火山引擎云基础产品经理负责人李越渊分享说,火山引擎4代ECS实例家族搭载英特尔至强6性能核处理器,并结合火山引擎自研DPU及自研服务器,在通用互联网场景、算力密集及IO密集场景,性能相比上一代都实现了大幅提升。
存储方面
,无论是企业级数据存储、分布式文件系统,还是大规模数据备份与恢复,都对存储服务器的性能、密度、能效以及TCO提出了更高要求。
为应对这些挑战,至强6围绕存储场景进行了大量优化设计,包括在单路最高支持136条PCIe 5.0通道,双路系统可搭载32块以上PCIe Gen5固态盘;通过内置的QAT和DSA引擎,高效执行数据压缩、加密、传输和转换操作,释放CPU核心资源,有效降低数据访问延迟。
内存方面
,在至强6平台上,英特尔率先提供内存介质MRDIMM,显著提升了全球环境模式(GEM)与全球预测模型(GDPS)的预报精度和模拟速度。
国内某知名高校则利用至强6加速基因测序、蛋白质结构解析与药物分子动力学模拟,满足其对高双精度算力、大容量内存以及AI训练与推理融合计算的需求。
陈葆立说,在球队,好队友的标准是传球要快、够稳定,还能在恰当的时候出现在恰当的位置,把球送到你面前,而至强6就是这样的“神队友”——超高速传输、显著降低时延,让数据像精准的快传一样在系统间奔跑,传得更多、更快、更稳。
另一点是
可靠
,数据中心有两个方式来诠释这个能力。
一是数据安全可靠。过去几年,英特尔在不同平台上推出了数据可靠的平台方案,通过与国内许多软件厂商和云服务商紧密合作,TDX技术已在云上落地,真正实现数据可用不可“见”。
二是可靠服务器设计。过去十年,英特尔在数据中心硬件设计及软件设计上做了许多工作,希望能达成高可用、高可靠、高可调的目标。至强6构建了广泛兼容企业软硬件环境的成熟生态,确保持久稳定的高性能计算服务,助力AI服务器实现“五个9”(99.999%)的运行可用。
据中兴通讯副总裁、算力产品总经理张振分享,英特尔至强6高性能处理器优异的AI特性表现,使中兴通讯智算服务器有了更强的性能提升。中兴通讯正交超节点服务器可支持单机柜32卡和64卡,最大规模扩展可支持8192卡,能够满足大模型的训推场景,其框内GPU之间采用正交互联的方式,相比CABLE线缆互联带来更优的成本和质量的收益,已在国内某大型互联网企业落地部署。
软件方面
,在大模型最新发展方向上,英特尔通过组合方案,为厂商带来更平衡的选择,更好地满足用户在价格与性能之间的双重需求。针对这些软件解决方案,英特尔研究团队过去几个月进行了深入探索,并在第一时间将代码上传至开源社区,期待与中国的软件服务商合作,共同推动至强6的软件优化。
越来越多企业探索AI落地的可能性,对成本控制和灵活部署都提出了更高要求。为此,英特尔推出了全新AI加速器Gaudi 2E,不仅在硬件层面实现突破,更在过去6个月中,由软件团队完成对中国主流开源大模型的第一时间适配与性能优化。
许多本地创新企业正在教育、医疗、政务等领域寻找AI落地的方案。英特尔也在第一时间将这些新AI应用迁移至算力池,并由本地团队提供协作支持。
超聚变算力领域与拓展部总裁唐启明分享说,超聚变联合英特尔打造AI Infra底座,通过FusionServer AI服务器和Gaudi 2E联合调优,实现用户并发量的大幅提升,并基于英特尔QAT压缩技术的协同优化,实现缓存容量、首token延迟的大幅下降。
未来数据中心面临装不下、来不及、做不到等挑战。英特尔团队保持开放态度,与合作伙伴共同讨论如何设计一个未来的超节点。
据华勤技术数据事业部总经理程励之透露,基于英特尔至强处理器和AI加速器的产品组合,结合华勤的技术储备、先进制造与全栈能力,华勤技术与英特尔自两年前就开始了面向超节点的合作,去年将部分重要开发成果开放,在此基础上共同制定了ETH-X超节点整机柜设计规范及计算节点参考设计。上个月在美国的OCP峰会上,这项基于英特尔AI加速器的超节点方案正式亮相。
网络方面
,英特尔在网络方案领域多年深耕,从传统以太网网卡到至强SoC处理器,再到面向互联网客户的多种智能网卡方案,始终与中国伙伴保持紧密合作,共同推动技术进步。
立讯公司智算产业CEO黄威分享说,立讯公司与英特尔在DPU和服务器整机方面都有了更加深刻的合作,出货量也更加喜人,立讯公司通过四层架构,在今年世界人工智能大会上发布了万卡集群,单机柜可实现128卡,同时在服务器机头上采用了英特尔方案,设计了一款全世界最薄的2U8卡机并成功部署投用。
总的来看,英特尔拥有广泛的数据中心产品组合,从至强处理器到智能网卡,正在帮助数据中心和云合作伙伴应对通用计算、AI计算、数值仿真计算和存储等多样化的算力需求。
此外,在PC领域,英特尔正联手合作伙伴探索AI PC的新形态,打造深度融合模型及数据的AI原生PC,开发AI PC智能体应用。
在边缘场景,垂直客户正基于英特尔平台大规模部署生成式AI,覆盖具身智能、智慧教育、智慧零售、智慧医疗、智慧城市、智慧工业等广泛领域,开拓端侧计算新未来。
今年适逢英特尔进入中国市场四十年,2025英特尔技术创新与产业生态大会汇集从客户端和边缘到云和数据中心的生态伙伴,全面呈现英特尔在智能计算领域的最新进展与实践,并通过14大场景体验区展出超过1000项产业生态合作成果。
来源:网易
通信人家园 (https://www.txrjy.com/)
Powered by C114