通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  上校

注册:2016-3-7220
发表于 2024-4-15 09:51:16 |显示全部楼层

在去年9月份的Innovation 2023大会上,英特尔CEO帕特·基辛格(Pat Gelsinger)喊出了AI PC的概念,随即在PC市场上刮起了一股AI飓风。在AI的加持下,已步入“不惑之年”的PC再次迎来了寒武纪时代“生命大爆发”,预计将于2024年出货4000万台AI PC。


“点石成金”术还在继续上演。在本周举行的Intel Vision 2024大会,英特尔发布了为企业客户打造的全新AI战略,宣布了英特尔至强6处理器的全新品牌,推出英特尔Gaudi 3加速器,以高性能、开放性和灵活性助力企业推进生成式AI创新,并发布了涵盖全新开放、可扩展系统,下一代产品和一系列战略合作的全栈解决方案,以加速生成式AI落地。


17130078516951.png


正如帕特·基辛格表示:“创新技术正在以前所未有的速度发展,每家公司都在加速成为AI公司,这一切都需要半导体技术提供支持。从PC到数据中心再到边缘,英特尔正在让AI走进千行百业。英特尔最新的Gaudi、至强和酷睿平台将提供灵活的、可定制化的解决方案,满足客户和合作伙伴不断变化的需求,把握住未来的巨大机遇。”


企业AI迎来发展转折点


毫无疑问,2023年是生成式AI元年,但如何把生成式AI融入到企业商业模式中,却没有太多案例可参考。cnvrg.io的调研结果,2023年只有10%的企业成功将其生成式AI项目产品化。


英特尔公司市场营销集团副总裁、中国区数据中心销售总经理、中国区运营商销售总经理庄秉翰表示,预计2026年,80%的企业将会使用生成式AI,50%的企业将会规模部署AI边缘。生成式AI投资也将水涨船高,今年会达到400亿美元,到2027年会达到1510亿美元。


庄秉翰指出,对于企业级用户而言,AI将从当前作为工具的“AI辅助时代”,逐渐进入AI赋能各领域工作流程自动化的“AI助手时代”,并最终进入AI推动企业部门自动化的“全功能AI时代”。“基于多个不同AI的数据交流,将会提供更全方位且更精准的价值。

庄秉翰强调,当前生成式AI的出发点基本是面向消费者,大模型训练的数据来源主要是互联网;但企业用户的很多数据都是部署在本地或者私有云,如何把企业的隐私数据和通用大模型结合在一起就变成了很大的挑战。“所以,英特尔提出企业AI的概念,即如何通过开放的生态,能够更开放的、更经济的、更有规模性的、更可靠的帮助企业释放AI潜力。“


企业AI:开放生态堆栈才是“最优解”


庄秉翰认为,企业AI与AGI大模型所需要的能力是不同:AGI大模型过于依赖GPU形态,企业AI对于算力的需求则更加多样化,而且还要具备可获取性、隐私性;其次,企业AI基础设施要具备可扩展性和标准化,既支持私有云,也需要支持公有云部署。再次,软件需要具备可靠性,理想状态下应该是基于公开API或者是开源,可以更好的通过社区获取。


算力同样是企业AI的基础。在算力角度,英特尔可以提供从云到边再到终端的多元异构算力,不仅能够带来性能上的提升,还具备隐私性。在Intel Vision 2024大会上,英特尔宣布为面向数据中心、云和边缘的下一代处理器进行品牌焕新,即英特尔至强6。


17130078513107.png


17130078519003.png


其中,配备能效核的英特尔至强6处理器(代号为Sierra Forest),与第二代英特尔至强处理器相比,每瓦性能提高2.4倍,机架密度提高2.7倍。配备性能核的英特尔至强6处理器(代号为Granite Rapids):包含了对MXFP4数据格式的软件支持,与使用FP16的第四代至强处理器相比,可将下一个令牌(token)的延迟时间最多缩短6.5倍,能够运行700亿参数的Llama-2模型。


与此同时,英特尔还宣布推出Gaudi 3 AI加速器,与上一代产品相比,英特尔Gaudi 3将带来4倍的BF16 AI计算能力提升,以及1.5倍的内存带宽提升。英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型,以及1750亿参数GPT-3模型的训练时间。


大模型需要大算力,大算力需要大集群,大集群则需要大网络。英特尔中国网络与边缘事业部首席技术官、英特尔高级首席AI工程师张宇指出,网络将会成为动辄万卡的AI智算中心的另一个瓶颈,解决网络拥塞问题,将是制约大模型性能提升以及规模扩张的核心要素。


17130078516925.png


张宇表示,在智算中心网络层面,英特尔秉持着开放思路,通过超以太网联盟(UEC)驱动面向AI高速互联技术(AI Fabrics)的开放式以太网网络创新,并推出一系列针对AI优化的以太网解决方案,包括英特尔AI网络连接卡(AI NIC)、集成到XPU的AI连接芯粒、基于Gaudi加速器的系统,以及一系列面向英特尔代工的AI互联软硬件参考设计。据张宇透露,英特尔将在下半年推出第一代基于ASIC IPU的产品,能够提供高达200GB/s性能,以及非常灵活的包处理能力,满足大模型时代对网络的要求。


张宇指出,对于企业AI而言,边缘将会是极其重要的应用场景。但在AI能力需求方面,边缘与云是截然不同的,边缘往往是异构架构系统,而且碎片化非常明显。对此,英特尔可以提供包括凌动处理器、酷睿处理器、酷睿Ultra处理器以及锐炫独立显卡等在内的丰富产品组合,来满足用户对媒体处理、AI处理、数据传输等多方面的要求。


在企业AI战场上,不仅需要硬核科技,软实力也同样重要。英特尔公司副总裁、英特尔中国软件和先进技术事业部总经理李映指出,AI时代,整个软件堆栈发生了巨大转变,软件在传统IT架构、云架构、AI架构融合过程中的作用凸显。


在底层物理层,英特尔软件可以保证硬件性能得到充分释放,而且支持不同硬件架构之间实现互联互通,共同协作,提供安全的、及时的、高性能的功能;从基础架构角度,软件可以对各种IT资源进行调配、标准化、扩展化;在应用层,在企业AI模块化的趋势下,软件可以实现基于各种应用的编程框架。与此同时,英特尔也在极力推动基于AI的软件创新。以PyTorch为例,英特尔一直是PyTorch的重要贡献者;oneAPI的下载量更是超过100万次。


企业AI :可落地才是关键


在谈到“企业AI”时,英特尔公司市场营销集团副总裁、中国区云与行业解决方案部总经理梁雅莉表示,大模型及生成式AI的智力涌现,如何在行业中成功落地至关重要。


“技术并非为技术而生,而是为落地而生。”梁雅莉指出,“英特尔始终坚持强调与生态系统伙伴的合作,始终秉承着‘水利万物而不争’的理念。尤其当新技术潮流来临、新一代技术应用扩展之时,开放、可靠和易部署的策略对终端用户来说极为关键。”


梁雅莉表示,对于企业用户来讲,在面对不同选择之时,会优先考虑几点:第一是“可及”,即该算力是能够获取且通用的;第二是追求不错的性能,第三则是在易部署的前提下,拥有可靠的保障。以金山云为例,英特尔与金山云合作,在其第七代性能保障型云服务器 X7 中引入了第四代至强可扩展处理器进行了针对性优化。


同样是在云服务领域,京东云已经部署了数百个AI应用场景。譬如在智能营销方面,京东实现了能够根据产业洞察及带货思维进行服务的数字人;在智能客服方面,京东云利用AI技术实现了拥有超大服务量并具备多模态理解能力的智能客服。这些大模型应用背后,是基于英特尔至强可扩展处理器的云基础设施。基于第五代至强可扩展处理器的京东云新一代云服务器整体性能较上一代提高了23%。


不仅在云服务领域,在智能制造领域。TCL华星结合英特尔端边技术能力,成立TCL华星光电与英特尔智能制造联合实验室,实现了设备端取图、端边计算、终端显示、结果反馈等闭环方案的打通。同时,在生产线检测体系和智慧物流中,TCL华星借助英特尔提供的硬件产品和“云边端”架构,降低了人力和设备配置成本,使产品良率得到迅速提升。


英特尔公司市场营销集团副总裁、英特尔中国网络与边缘及渠道数据中心事业部总经理郭威也在发言中分享了,英特尔与科东软件在智能机器人领域的合作。郭威指出,生成式AI让机器设备、机器人具有了自我学习、自我生成的能力。可以根据客户需求,自动生成PLC逻辑控制器代码用于机器人的运动控制,极大降低设备使用成本。英特尔推出的酷睿Ultra处理器,在CPU、GPU和NPU三个功能之间实现平衡,让机器人设备更为智能。


郭威表示,针对物联网和边缘计算场景,英特尔会和过去10年一样,深入了解行业的需求和痛点,利用英特尔从端到云的产品组合,支持服务好客户,满足客户的差异化需求。


举报本楼

您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-5-26 19:10 , Processed in 0.825971 second(s), 19 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部