通信人家园

标题: DeepSeek V4终于发布！打破最强闭源垄断，明确携手华为芯片 [查看完整版帖子] [打印本页]

时间: 2026-4-24 13:45

作者: flixwye 标题: DeepSeek V4终于发布！打破最强闭源垄断，明确携手华为芯片

DeepSeek V4终于发布！打破最强闭源垄断，明确携手华为芯片
henry 鱼羊发自凹非寺
量子位 | 公众号 QbitAI
刚刚，DeepSeek-V4来了！
预览版正式上线并同步开源。
一共两个版本：
DeepSeek-V4-Pro：对标顶级闭源模型，1.6T，49B激活，上下文长度1M；
DeepSeek-V4-Flash：更小更快的经济版，284B，13B激活，上下文长度1M。
官方原话是：在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。
并且：
目前DeepSeek-V4已经成为公司内部员工使用的Agentic Coding模型，据评测反馈使用体验优于Sonnet 4.5，交付质量接近Opus 4.6非思考模式。但仍与Opus 4.6思考模型存在一定差距。
目前官网和APP都上了，API服务也已同步更新。
大家都关心的国产算力方面，划重点，下半年支持华为算力。
这次V4一口气发了两个版本。
V4-Pro，性能比肩顶级闭源模型。
官方给出的判断有三条：
Agent能力大幅提高：在Agentic 能力Coding评测中，V4-Pro已达到当前开源模型最佳水平，并在其他Agent相关评测中同样表现优异。内部测评中，Agent Coding模式下，V4体验优于Sonnet 4.5，交付质量接近 Opus 4.6非思考模式，但仍与 Opus 4.6思考模式存在一定差距。
丰富的世界知识：DeepSeek-V4-Pro在世界知识测评中，大幅领先其他开源模型，仅稍逊于顶尖闭源模型Gemini-Pro-3.1。
世界顶级推理性能：在数学、STEM、竞赛型代码的测评中，DeepSeek-V4-Pro超越当前所有已公开评测的开源模型，取得了比肩世界顶级闭源模型的优异成绩。
V4-Flash，更小更快的经济版。推理能力接近Pro，世界知识储备稍逊一筹，但参数和激活更小，API更便宜。
在Agent任务方面，DeepSeek-V4-Flash在简单任务上与DeepSeek-V4-Pro旗鼓相当，但在高难度任务上仍有差距。
在洗车测试上，V4也是快速通过。
而在“绝望的父亲”这个经典的生物学场景当中，DeepSeek-V4并没有一轮get到红绿色盲这个关键点（根据遗传学规律，如果一名女性是红绿色盲，其生物学父亲必然也是）。
值得一提的是，从今天开始，1M上下文是DeepSeek所有官方服务的标配。
一年前，1M上下文还是Gemini独家的王牌；其他所有闭源模型要么128K要么200K；开源这边几乎没人玩得起这个量级。
DeepSeek直接把百万上下文从一个「高端功能」挪成了「水电煤」。
而且开源。他们怎么做到的，发布稿里直接给了答案——
V4开创了一种全新的注意力机制，在token维度进行压缩，结合DSA稀疏注意力一起用。相比传统方法，对计算和显存的需求大幅降低。
DSA不是新词。半年前V3.2-Exp那次更新首次引入，当时外界关注度不高，因为跑分和V3.1-Terminus几乎一样，看起来像一次没什么料的中间版本。
现在回头看，那是V4的地基。
Agent这边，V4针对Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent产品做了适配和优化，代码任务、文档生成任务都有提升。
发布稿里还附了一张V4-Pro在某Agent框架下生成的PPT内页示例。
API这边，V4-Pro和V4-Flash同步上线,支持OpenAI ChatCompletions接口和Anthropic接口两套。
base_url 不变,model 参数改成 deepseek-v4-pro 或 deepseek-v4-flash 即可调用。
两个版本最大上下文都是1M,都同时支持非思考模式和思考模式。思考模式下可以通过reasoning_effort 参数调强度,两档high和max。官方建议复杂 Agent 场景直接上max。
这里有个重点——下半年支持华为算力。
此外，旧模型名要下架。
deepseek-chat和deepseek-reasoner将在三个月后(2026年7月24日)停用，当前阶段内这两个名字分别指向V4-Flash的非思考和思考模式。
对个人开发者影响不大，改一个model参数。对接了生产环境的公司，这三个月要去做迁移。
发布稿的结尾，DeepSeek 自己引了一句话。
「不诱于誉，不恐于诽，率道而行，端然正己。」
这是荀子《非十二子》里的一句。字面意思是，不被赞誉诱惑，不被诽谤吓到，按自己认定的道往前走，端正自己。
放在今天这个场景里，有点意思。
过去半年，关于V4什么时候发、是不是跳票、是不是已经被别家超越、是不是已经被 Claude 蒸馏数据搞定了之类的传言在中文和英文AI圈来来回回跑了好几轮。年初甚至还有人信誓旦旦说V4会在春节前发，结果等到了四月底。
他们没回应过一次。
然后在某个周五的下午，把V4放出来，同步开源，同步上线官网和App，同步更新API，顺便把内部员工已经弃用Claude的事实写进发布稿。
没有路线图，没有直播，没有访谈。
率道而行这四个字，听着像是一句口号。但如果你把过去半年 V3.2 那次「没什么亮点」的 Exp 版本、DSA那套为V4铺了半年的稀疏注意力、1M 上下文从王牌变成标配的这条路径放在一起看。
DeepSeek已经做到了。

时间: 2026-4-24 14:06

作者: szlanjack

强力挤压华尔街AI泡沫。。

时间: 2026-4-24 14:14

作者: 10219459

那个天天说中国国内买了H200的仔呢？

时间: 2026-4-24 16:27

作者: ghbiou

万分期待！！！

时间: 2026-4-24 16:55

作者: lmla2070

szlanjack 发表于 2026-4-24 14:06
强力挤压华尔街AI泡沫。。

时间: 2026-4-24 18:31

作者: flixwye

10219459 发表于 2026-4-24 14:14
那个天天说中国国内买了H200的仔呢？

米国商务部长4月前几天说了，一颗都没卖出

时间: 2026-4-24 18:31

作者: flixwye

10219459 发表于 2026-4-24 14:14
那个天天说中国国内买了H200的仔呢？

一颗都没卖出

时间: 2026-4-24 23:19

作者: 看看夕阳

客总没话说？

时间: 2026-4-25 11:56

作者: 一日囚

看看夕阳发表于 2026-4-24 23:19
客总没话说？

他理解不了这么复杂的业务。他在另一个帖子里说DeepSeek没几个人用，还不如豆包，被我打脸，我当时给他的回复：
非常多的行业的大型企业的科技总，25年初春节假期结束第一天开会就是讨论Deepseek，甚至过年期间就在热烈讨论了。各行各业，几乎所有你叫的出名字的大型企业，如果部署了大模型，基本上都部署了Deepseek的开源大模型。今年过年放假前，不少AI这条线的打工人心里都在默默的期盼，Deepseek V4不要在春节前发布，因为大家都想好好过个年。大型企业着急部署Deepseek V4，发布后一天都不能等不想等，就像当年有些爆款手机上市，消费者彻夜排队买一样，从这些细节你应该就知道Deepseek有多少人在用，江湖地位多重要了。
你不知道这些是有客观原因，学历低可能只能在网上了解下AI但并没有参与这个产业，仇恨又蒙蔽了你的双眼，再加上智商感人，不怪你。

时间: 2026-4-25 12:19

作者: 客家人

一日囚发表于 2026-4-25 11:56
他理解不了这么复杂的业务。他在另一个帖子里说DeepSeek没几个人用，还不如豆包，被我打脸，我当时给他的 ...

你开心就好
2025年初deepseek确实轰动，全民在了解deepseej，英伟达估计还暴跌，可是……，这行业瞬息万变，别人追的也很快。
你看deepseek发布最新版，有几个在意了？deepseek为了适配昇腾，多次推迟发布，市场都被抢完了。
告诉你一个不好的消息，小米搞的开源大模型，也排名全球前五

时间: 2026-4-25 13:05

作者: 一日囚

客家人发表于 2026-4-25 12:19
你开心就好
2025年初deepseek确实轰动，全民在了解deepseej，英伟达估计还暴跌，可是……，这行业瞬 ...

第一，昨天V4发布，在意的人多的去了。你可能不了解智算，不清楚这个开源大模型应用情况，昨天非常多的大企业新闻稿都发了，微信公众号上一堆，讲DAY0就部署并应用了大模型，网上搜搜特别多。
第二，小米大模型做的好为什么是坏消息呢？我觉得是好事。我最喜欢和支持华为，但没有踩一捧一的习惯，小米好的产品我也支持。比如异地工作租的房子，我就买了小米的扫地机器人，性价比高划算。家里用的是科沃斯的，品质高。

时间: 2026-4-25 13:14

作者: 一日囚

客家人发表于 2026-4-25 12:19
你开心就好
2025年初deepseek确实轰动，全民在了解deepseej，英伟达估计还暴跌，可是……，这行业瞬 ...

补充一下，你应该比较熟悉的金山办公也在day0接入和适配了deepseek v4，我刚刚搜了一下看见的：
金山办公4月24日的官方动作是双管齐下的：一边通过 WPS 36知乎/社区/官微宣布云端产品（灵犀）接入 V4；另一边通过线下发布会推出“轻舟 AI”，为企业客户本地化部署 V4 提供底座。

时间: 2026-4-29 13:00

作者: 奋斗士

客家人发表于 2026-4-25 12:19
你开心就好
2025年初deepseek确实轰动，全民在了解deepseej，英伟达估计还暴跌，可是……，这行业瞬 ...

deepseek为了适配昇腾，多次推迟发布，市场都被抢完了
~~~~~~~~~~~~
少看点这些吹捧华为的小作文，

DeepSeek核心开发人员离职，卡算力受限。。。

人、卡这两个关键资源，都遇到了麻烦，才是V4不停推迟的原因。。。都没太用华为卡训练，和华为半毛线关系没有。。。

时间: 2026-4-29 13:03

作者: 奋斗士

客家人发表于 2026-4-25 12:19
你开心就好
2025年初deepseek确实轰动，全民在了解deepseej，英伟达估计还暴跌，可是……，这行业瞬 ...

DeepSeek多模态的核心开发人离职了，去了元戎启行做纯视觉VLA，

所以，DeepSeek至今这个版本，都仍然是纯文本的大语言。。。

说华为卡能训练出DeepSeek，那是给华为卡涨大脸了。。。

PS：
再等个3年，国产可能真有能训练出不错模型的卡，但那时就不清楚是哪家了

DeepSeek核心研究员阮.jpg

附件: DeepSeek核心研究员阮.jpg (2026-4-29 13:01, 315.84 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=NzIxOTAwfGE0YWU1ODEwfDE3ODAyNjEzMDR8MHww

附件: DeepSeek核心研究员.jpg (2026-4-29 13:01, 315.4 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=NzIxOTAxfDI0ZTg0YWRjfDE3ODAyNjEzMDR8MHww

时间: 2026-4-29 15:08

作者: 奋斗士

本帖最后由奋斗士于 2026-4-29 15:09 编辑

DeepSeek V4训练，是英伟达。。。

DeepSeek V4推理，Day0适配了8个国产卡。。。

这个文章一股浓浓的误导味道，写的像DeepSeek专门和某一家合作、其他国产没有份一样。。。

时间: 2026-4-29 15:48

作者: Good_Lucky_Come

好乱，哪个才是真实的

时间: 2026-4-29 16:30

作者: flixwye

奋斗士发表于 2026-4-29 13:00
deepseek为了适配昇腾，多次推迟发布，市场都被抢完了
~~~~~~~~~~~~
少看点这些吹捧华为的小作文，

哈哈，粪总狠起来连客总都扇

时间: 2026-4-29 17:18

作者: 奋斗士

flixwye 发表于 2026-4-29 16:30
哈哈，粪总狠起来连客总都扇

我没那么强的立场，

单纯看不惯整天瞎编故事、瞎乱吹、瞎乱黑。。。

PS：
有些人确实属于立场第一，是非靠后，我不是

时间: 2026-4-29 17:19

作者: 奋斗士

一天天看到那些整天乱编故事、乱吹、乱黑的东西，尤其是还热度极高的话，看的真的想吐

时间: 2026-4-29 18:31

作者: Desla的马甲

本帖最后由 Desla的马甲于 2026-4-29 18:46 编辑

奋斗士发表于 2026-4-29 17:18
我没那么强的立场，

单纯看不惯整天瞎编故事、瞎乱吹、瞎乱黑。。。

这伙计貌似把大家当傻瓜了。一门心思花那么多精力收集整合黑菊材料，就没见对其他公司这么上心过。还敢说没那么强立场。这到底是层主太自我了，还是层主觉得自己说自己是啥，别人就信了？
比如客总说自己只是实话实说，根本就不是菊黑，然后大家就信了？
所以，说自己没那么强立场的人，到底是不是傻呢。所以，承认自己就是有立场，真的很掉价吗？人家真USA人，可是时时把美国优先放嘴上，这么强的立场，也没见精美人说有问题呢。怎么就承认自己讨厌或者恨菊司，有那么困难么？

时间: 2026-4-29 19:26

作者: 奋斗士

Desla的马甲发表于 2026-4-29 18:31
这伙计貌似把大家当傻瓜了。一门心思花那么多精力收集整合黑菊材料，就没见对其他公司这么上心过。还敢 ...

你眼里，只有对谣言点赞转发的人，才是正常行为？

反驳谣言，变成了整理黑材料？

时间: 2026-4-29 21:48

作者: h68810115

10219459 发表于 2026-4-24 14:14
那个天天说中国国内买了H200的仔呢？

对人家尊重点还吧，人家可是随意安排字节花1500亿采购100万卡英伟达的大佬，还再安排字节再花大几百亿买100万的国产算力卡。

随随便便就2000多亿就安排了，你要学会尊重，我看到发言之后，大多数时候都尊称奋总为“您”

时间: 2026-4-29 21:52

作者: h68810115

Desla的马甲发表于 2026-4-29 18:31
这伙计貌似把大家当傻瓜了。一门心思花那么多精力收集整合黑菊材料，就没见对其他公司这么上心过。还敢 ...

品味一下“3月28日小米汽车发布，4月份特斯克销量下降明显”，这已经远超贴金了，简直就是给雨田君换了一个999的黄金脑袋。

雨田君都为“相当于120公里撞墙”道歉，我们奋总说，你没错，你不能错，60公里相向而行，就是120公里

这样的人才，要尊重

时间: 2026-4-30 00:30

作者: SOHU2021

小米Mimo大模型开始公测了 xiaomimimo.com

时间: 2026-4-30 17:27

作者: Desla的马甲

奋斗士发表于 2026-4-29 19:26
你眼里，只有对谣言点赞转发的人，才是正常行为？

反驳谣言，变成了整理黑材料？

是否有立场不是自己说的。说自己没立场的人，不是自己心理没成年，就是把别人当傻子。都是成年人了，怎么还那么幼稚呢。

时间: 2026-4-30 17:32

作者: 奋斗士

Desla的马甲发表于 2026-4-30 17:27
是否有立场不是自己说的。说自己没立场的人，不是自己心理没成年，就是把别人当傻子。都是成年人了，怎么 ...

造谣吹捧的，是客观公正，

回击谣言的，是立场不正

时间: 2026-4-30 17:34

作者: oooooooo

奋斗士发表于 2026-4-30 17:32
造谣吹捧的，是客观公正，

回击谣言的，是立场不正

从你刚发的帖看，我可没觉得你是回击谣言，因为我没听说过什么筑底成功，如果真有这说法的话我觉得你在助长吹捧传播

时间: 2026-4-30 17:39

作者: Desla的马甲

本帖最后由 Desla的马甲于 2026-4-30 17:39 编辑

奋斗士发表于 2026-4-30 17:32
造谣吹捧的，是客观公正，

回击谣言的，是立场不正

这是你说的哈。别安在别人头上。我这里只是对你说自己没有很强的立场的评价：要么是自己傻，要么是把别人当傻瓜。

时间: 2026-4-30 17:41

作者: oooooooo

Desla的马甲发表于 2026-4-30 17:39
这是你说的哈。别安在别人头上。我这里只是对你说自己没有很强的立场的评价：要么是自己傻，要么是把别 ...

他总是喜欢把不知道哪里看到的说华为好的观点扣在所有反对他的人头上，然后自诩公正

时间: 2026-4-30 19:18

作者: 客家人

  告诉某司人一个坏消息，小米自研的大模型，今年已经连续好多周排名前10
  盘古大模型何在？
  王云鹤都跑路了，也就石锤了去年的事。
  盘古大模型的事，手法太熟悉了
  销售前端，狂吹盘古大模型遥遥领先，绝对领先，把单子签回来了
  然后自己内部发现投入不足，满足不了要求
  最后。。。。。。。。。。。。

通信人家园 (https://www.txrjy.com/)