通信人家园

标题: DeepSeek V4彻底抛弃英伟达:全面切换华为芯片,阿里腾讯字节抢购数十万颗  [查看完整版帖子] [打印本页]

时间:  2026-4-9 11:35
作者: coffee198375     标题: DeepSeek V4彻底抛弃英伟达:全面切换华为芯片,阿里腾讯字节抢购数十万颗

弃用英伟达,不是选择,是被迫完成的进化

4月4日,据《The Information》援引五位知情人士消息,DeepSeek即将发布的旗舰模型V4将完全运行于华为设计的芯片之上,且阿里巴巴、字节跳动、腾讯已联合提前下订单,总采购量达数十万颗华为最新AI芯片。

这不是一次普通的供应商更换,而是中国AI产业链在持续出口管制压力下,完成的一次系统性重构。

回溯DeepSeek的发展路径:V2、V3、R1这几代模型,虽然早已在技术上证明了自身实力,但底层计算基础设施依然高度依赖英伟达H系列GPU。而V4,将是第一个从一开始就被设计成"只跑国产芯片"的顶级模型。

1万亿参数 + 100万token:V4的技术野心

根据目前泄露的信息,V4将采用接近1万亿参数的架构,支持100万token的超长上下文,推理速度相比上一代提升约1.8倍。这一性能水平,直接对标GPT-5和Claude 3.7。

为了让V4能够在华为昇腾芯片上高效运行,DeepSeek的工程师与华为、寒武纪的芯片团队紧密协作数月,对模型底层算子进行了大规模重写和优化——这不只是软件适配,更是在重新定义什么是"为国产硬件而生的AI模型"。

一个尤为值得关注的细节是:DeepSeek没有向任何美国芯片厂商提供V4的早期测试权限。这意味着英伟达甚至无法针对V4优化其CUDA生态。这是一道明确的分界线。

巨头抢货:为什么阿里、腾讯、字节都在囤华为芯片

三家科技巨头联合提前下单,释放的信号非常清晰:V4已经过内部测试,性能足以说服国内最顶级的AI应用团队切换底层算力。

对于这三家公司而言,这也是一道战略题:现在用美国算力做AI,未来面临的不只是成本问题,还有随时可能被切断的风险。而华为的昇腾生态,正在成为国内大模型"断供免疫"的核心基础设施。

寒武纪股价随消息上涨2.67%,市场已经提前投票。

反制效果的悖论:管制越严,脱钩越快

美国商务部的出口管制逻辑是:只要中国拿不到最先进的芯片,AI发展就会慢下来。但DeepSeek的路径打破了这个假设。

从V3开始,DeepSeek就证明了可以用受限硬件训练出世界级模型。而V4则更进一步:不是"用次等硬件做最好的事",而是完全重构算法和底层代码,让国产芯片成为一流选择

这种倒逼式创新正在产生一个历史性效果:中美AI算力生态的实质性分轨。而这条分轨一旦完成,就很难逆转。

V4上线后,全球AI格局将怎么变

如果V4的性能如传言所说,这将是首个完全运行于自主芯片生态、同时在全球顶尖指标上对标GPT-5的大模型。它的意义不只在技术层面:

对全球AI芯片市场:英伟达的护城河是CUDA生态,但如果最先进的中国模型不再需要CUDA,英伟达在这片最大增量市场的份额将加速萎缩。

对国内AI生态:大模型基础设施的自主可控将从"目标"变成"现实",使得国内AI应用的战略规划不再需要预留"算力断供"的风险敞口。

对全球AI开发者:一个全面运行于华为芯片的顶级开源模型,将倒逼更多开发者工具和框架向非CUDA平台迁移,打破英伟达生态的隐性垄断。
美国管制想要减缓的,实际上正在被加速。DeepSeek V4不只是一个模型,它是中国AI基础设施从"适应限制"到"重塑规则"的分水岭。当最强的中国模型开始为华为芯片量身定制,这场AI算力的全球博弈,已经进入了一个新的阶段。


时间:  2026-4-9 11:37
作者: coffee198375

美国出口管制原本是为了遏制中国AI发展,却在事实上加速了中国完整AI芯片生态的成型。DeepSeek V4即将在纯华为芯片上跑通1万亿参数大模型,这是一个历史性拐点。。。。
时间:  2026-4-9 13:30
作者: 深圳普通用户

DeepSeek还有人在用吗?
我周围的人以前用过DeepSeek的都改用豆包了。
时间:  2026-4-9 13:35
作者: recdragon

深圳普通用户 发表于 2026-4-9 13:30
DeepSeek还有人在用吗?
我周围的人以前用过DeepSeek的都改用豆包了。

同感
时间:  2026-4-9 14:30
作者: liyoo

猴子们真的搞笑
时间:  2026-4-9 14:30
作者: 看看夕阳

这些内容看看就好,实际要看最后落地情况,其实不转过来最好,避免大家又讨论,某些人心情不好。
时间:  2026-4-9 14:33
作者: progrese

支持国产
时间:  2026-4-9 14:43
作者: 无敌又洒脱

看看迟迟不推出新模型应该是还在打磨华为的技术栈。
时间:  2026-4-9 15:35
作者: flixwye

DeepSeek本来重心和精力就不在C端消费侧那种问答类应用,客总居然说DeepSeek没落了,真TM无语
时间:  2026-4-9 16:11
作者: diyishang

是训练还是推理?
时间:  2026-4-9 16:25
作者: 慢刀刘二

DeepSeek 居然没有鸿蒙版,还要用卓易通,这也是挺奇葩的~~~
时间:  2026-4-9 17:09
作者: szlanjack

人家华为还针对cuda生态提供一键移植到华为生态,这个就很难拒绝了,价格还比英伟达便宜。
时间:  2026-4-9 17:21
作者: coffee198375

本帖最后由 coffee198375 于 2026-4-9 17:22 编辑
深圳普通用户 发表于 2026-4-9 13:30
DeepSeek还有人在用吗?
我周围的人以前用过DeepSeek的都改用豆包了。

豆包是个人版,DS是工业版。。。。
时间:  2026-4-9 19:22
作者: 不吹不黑

大厂实力杠杠滴
时间:  2026-4-9 19:23
作者: 不吹不黑

深圳普通用户 发表于 2026-04-09 13:30:36 DeepSeek还有人在用吗?我周围的人以前用过DeepSeek的都改用豆包了。

豆包好用?
时间:  2026-4-9 19:41
作者: 客家人

不吹不黑 发表于 2026-4-9 19:23
豆包好用?

    豆包早就是民用第一了,用户量很大,受众很广,连小学一年级学生都用豆包解题目.....
    字节跳动的软件能力无敌
    字节Seedance已经让动画行业震动
时间:  2026-4-9 20:02
作者: 不吹不黑

客家人 发表于 2026-04-09 19:41:42 豆包早就是民用第一了,用户量很大,受众很广,连小学一年级学生都用豆包解题目.....    字节跳动...

厉害了!!




通信人家园 (https://www.txrjy.com/) Powered by C114