通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  大元帅

注册:2007-12-102279
跳转到指定楼层
1#
发表于 2025-11-17 10:44:13 |只看该作者 |倒序浏览

11月16日,知情人士向观察者网透露,华为将于下周发布AI领域突破性技术成果,有望解决算力资源利用效率难题。据透露,该技术延续 “以软件补硬件” 的创新思路,可将GPU、NPU等算力资源利用率从行业平均30%-40%大幅提升至70%,显著释放算力硬件潜能。


该知情人士提到,华为这项新技术将对标英伟达2024年底收购的以色列公司Run: ai的核心技术,旨在通过软件创新,实现英伟达、昇腾以及其他三方算力的统一资源管理与利用,屏蔽算力硬件差异,为AI训练推理提供更高效的资源支撑。


2024年12月,英伟达宣布以7亿美元(约合人民币51亿元)价格,收购2018年成立的以色列公司Run:ai。过去7年,这家公司做的产品只围绕一件事——怎么高效使用GPU,比如提供业务看板、GPU权限分配、任务分配等等直观可视化操作工具,本质是在做GPU的“数据产品经理”。


对于有雄厚研发实力和AI积累的大公司来说,这样的内部工具自研可能并不是问题,但对于中小规模、非AI行业的用户来说,Run:ai这套技术却很关键。


彼时有媒体报道,Run:ai的用户包括全球打印机巨头斑马技术、用端到端技术一鸣惊人的自动驾驶公司Wayve、伦敦医学影像与人工智能中心等等。其中Wayve通过Run:ai提供的工具,将原先不足25%的GPU集群效率,提升到80%以上。


在收购的同时,英伟达还宣布开源Run:ai的所有平台技术,买英伟达GPU就能免费用。


黄仁勋这么做的原因,是因为英伟达在AI芯片领域占据垄断地位,控制着高端GPU市场80%的份额,几乎100%的AI计算份额,且一直在寻求构建产品+生态的立体优势。


长期以来,黄仁勋和英伟达一直想做的,就是AI行业的垂直整合,从芯片到工具再到软件应用,打造一个能满足任何AI用户的一站式商店,让客户对其生态形成依赖。


然而,对当下中国来说,恰恰要避免对英伟达的过度依赖,尤其是在先进制程受限、单卡算力存在劣势的情况下,国内产业界更需要“系统补单点”、“软件补硬件”,支撑AI产业发展。


今年以来,华为曾推出多项关键技术,弥补芯片方面的短板。比如昇腾384超节点,该技术发挥华为在通信、存储和基础软件等方面的大杂烩优势,突破了互联瓶颈,实现了算力规模的赶超。再比如华为前不久开源的UCM(Unified Cache Manager)推理记忆数据管理技术,充分利用了不同存储介质的特性,降低AI推理对高端HBM的依赖,还能平衡成本。


AI是一项系统工程,算力更是一个高成本的代表。在中国先进芯片受限的情况下,华为即将发布的新技术,将如何提升算力资源利用的效率,无疑值得关注。


举报本楼

本帖有 13 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2025-11-17 22:18 , Processed in 0.131772 second(s), 20 queries , Gzip On.

Copyright © 1999-2025 C114 All Rights Reserved

Discuz Licensed

回顶部