通信人家园

标题: 没有商业模式，是DeepSeek最坚固的“护城河” [查看完整版帖子] [打印本页]

时间: 2026-1-19 17:12

作者: tayun 标题: 没有商业模式，是DeepSeek最坚固的“护城河”

在即将到来的1月27日——也就是“DeepSeek时刻”一周年之际，全球AI社区都期待DeepSeek再来个大招。

市场喧嚣期待之时，知名科技评论作者Kevin Xu发布长文对DeepSeek的商业模式、护城河进行了分析，在AI圈内引起了很大反响。

他认为，DeepSeek最坚固的护城河，是它零外部融资、无商业化压力的独特模式。在全球AI巨头都被资本裹挟着必须赚钱的时候，DeepSeek是唯一一个可以不计成本、不看脸色、只为AGI梦想狂奔的“自由人”。

Kevin S. Xu（徐凯文）是专注中美科技与资本交叉领域的独立观察者，知名科技评论人。他创办的ChinaTalk播客及Newsletter在专业圈层颇具影响力，擅长从资本流向、组织行为与地缘政治多维度解构技术演进逻辑。

我们给大家梳理了一下文章要点：

给市场预期泼盆冷水

：虽然大家都在等DeepSeek的新模型，但作者直言“不要指望它能像去年那样再次震惊世界”。因为现在的市场已经被“开源模型”喂饱了，DeepSeek虽然打响了第一枪，但现在并不是唯一、也不是最开源的玩家了（比如它至今没开源数据集）。

唯一的“零融资”异类

：现在的AI圈就是“销金窟”，连马斯克都没扛住，最近也给xAI融了一笔高达200亿美元的巨资。但DeepSeek的老板梁文锋至今坚持“零外部融资”，这在所有顶尖实验室里是独一份的，他把控制权看得比钱重。

超级“印钞机”兜底

：梁文锋能这么硬气，是因为他背后的量化基金“幻方量化”太赚钱了。去年，幻方以53%的回报率赚了超7亿美元（约50亿人民币）的利润。梁文锋直接把这些钱拿来买显卡、招人，这种用“老钱”养“新梦”的模式，让他完全不需要看投资人的脸色。

被VC拒绝反而是福报

：2023年DeepSeek刚成立时其实找过融资，但当时国内VC普遍短视、不敢投，结果这反而成了“塞翁失马”。作者认为，一旦拿了VC的钱，就必须背上商业化KPI，动作就会变形，而现在的DeepSeek只需要对技术负责，不需要对财报负责。

“钱多”麻烦多

：这是一个非常深刻的洞察——钱太多会滋生“大公司病”。作者举了个很讽刺的例子：有些富得流油的实验室（比如Thinking Machines），甚至在办公室健身房里用上了 印着自家Logo的定制杠铃片 。这种浮夸的排场背后，是员工盯着期权带来的“纸面富贵”，部门之间为了争夺算力资源搞“宫斗”。而DeepSeek因为没有外部估值，团队极度扁平，没有资源内耗。

算力不是万能药

：文章引用了前OpenAI大神Ilya Sutskever的观点—— 真正的颠覆性创新往往不需要无限堆算力 。Transformer架构当年只用了8到64张卡就跑出来了。钱太多反而会让团队变懒，以为堆算力就能解决一切，从而失去了“科研品味”。

投资人的终极悖论

：最后，作者站在一位投资人的角度发出了一声叹息——作为一个投资人，他做梦都想投DeepSeek；但他心里也清楚， 一旦DeepSeek接受了外部投资，那种纯粹的特质就会消失了 。

作者原文如下（由AI翻译）：

没有商业模式：DeepSeek的长期优势

随着1月27日“DeepSeek时刻（DeepSeek Moment）”一周年纪念日的临近，市场对于DeepSeek在农历新年（2月17日）前发布一款更强大新模型的期待正日益高涨。

然而，过高的期望几乎注定会带来失望。虽然我也急切地等待着这款新模型，想看看DeepSeek究竟在忙些什么，但我并不预期它会像一年前那样再次震惊市场。整个AI行业乃至更广泛的市场，已经习惯了每隔一两个月就有一款新的“开放权重”模型发布，尤其是来自中国实验室的模型，它们即便算不上最尖端，也往往表现扎实。凭借着开放和免费的特性，这些模型正以一种无法追踪和溯源的方式在各地获得牵引力——这也是开源技术整体上的一种美德（或者说是缺陷）。正如英伟达CEO黄仁勋喜欢说的那样，以Token生成量计算，世界上最大的AI仍然是OpenAI，但第二大的，是开源AI。

DeepSeek或许在去年通过发布V3和R1打响了MIT License许可的开源模型的第一枪，但其他实验室迅速跟进，从同样来自中国的竞争对手阿里巴巴及其Qwen（通义千问）模型系列，到OpenAI推出的gpt-oss模型。（两者均使用Apache 2.0许可，这是另一种常见的开源宽松许可。）正如我之前指出的，如果不是因为DeepSeek，OpenAI可能永远不会感受到压力，从而去兑现其开源根源的承诺，哪怕只是口头上的，比如发布gpt-oss。虽然DeepSeek继续开源其模型的权重以及各种工具和库，但它已不再是市场上最开放的实验室，因为它从未开放过其用于训练模型的数据集或主代码库。

根据Artificial Analysis的数据，目前全球开放程度排名前三的模型分别来自NVIDIA（Nemotron 3）、Allen Institute（Olmo 3）和穆罕默德·本·扎耶德人工智能大学（MBZUAI，K2-V2）。

因此，DeepSeek的模型不再是开放模型中能力最强的，不再是最便宜的，甚至也不再是最开放的。那么，是否还有一个充分的理由，让我们继续给予这个曾经震惊世界的实验室超乎寻常的关注？

是的，我认为有。但不是因为它的模型或技术进步，而是因为其内部的激励机制和商业模式。更确切地说，我们应该关注DeepSeek，因为它没有商业模式——在中国、美国及其他地区的所有前沿实验室中，这是一个独特且反直觉的特性，而非缺陷。

01 自筹资金支撑的 AGI 梦想

早在DeepSeek迎来其“高光时刻”并成为家喻户晓的名字之前的几周，我首次撰写关于DeepSeek的文章时（当时也在ChinaTalk播客上讨论过），就提到了这种“无商业模式优势”。值得注意的是，当整个AI世界都被资本淹没时，这种优势竟表现得如此顽固且持久。

梁文锋没有筹集任何外部资金。该实验室确实通过其API服务产生一些收入，但仍在不断降低定价。梁文锋满足于用他的量化基金——幻方量化的收益来资助DeepSeek的研发，正是幻方量化最初孵化了DeepSeek。需要明确的是，梁文锋在2023年ChatGPT推出几个月后想要创办DeepSeek时，确实曾尝试从中国投资者那里筹集风险投资。但他那“笃信AGI（AGI-pilled）”的理想主义，加上缺乏商业计划书，以及中国VC著名的短视和风险厌恶，导致了那次融资努力的失败——但这反而塞翁失马，焉知非福。

随着2025年的飞逝，为了不错过更多潜在的进步，越来越多的资金涌入，资助了更多的AI进展。每一个哪怕只有一点点牵引力的实验室都筹集了更多的钱，随之而来的是对未来商业化的更多期望。一批所谓的“AI新实验室”——由明星研究员领导的、风投支持的纯研究实验室——如雨后春笋般涌现，例如Thinking Machines Lab（Mira Murati）、SSI（Ilya Sutskever）和AMI Labs（Yann LeCun）。甚至连我过去常拿来与DeepSeek做最紧密类比的xAI——因为它们同样缺乏商业化的紧迫性——也屈服于外部资本的诱惑。几天前，埃隆·马斯克（Elon Musk）的实验室完成了一轮200亿美元的E轮融资，资金结构包含了股权和债权。

即便是世界上最富有的人之一，也无法对更多的钱说“不”！与此同时，梁文锋继续自筹资金维持他那神秘的店铺和他的AGI梦想。当然，梁文锋的量化基金去年业绩辉煌，以53%的回报率创造了超过7亿美元的利润，这无疑提供了巨大帮助。据推测，这些利润的大部分都投入到了购买更多GPU（尽管面临美国的出口管制，但尽其所能）和招聘人才上，以继续推动DeepSeek的研究路线图。尽管如此，在DeepSeek获得全球知名度并在AI行业实现100%的品牌认知度之后，筹集一二十亿美元以加速其步伐本应是轻而易举的事。无论你爱它还是恨它，每个人都听说过它。

然而，对外部资金说“不”，让你能够掌控自己的命运。如果你的自定命运是“致力于让AGI成为现实……用好奇心解开AGI之谜……用长期主义回答本质问题”——这是DeepSeek在HuggingFace页面上的标语——那么用较少的资金换取完全的控制权是一个值得的权衡。当然，你也可以通过一些“公司治理创新”来达到目的。Thinking Machines Lab就是这种情况，创始人的1票投票权价值比所有其他董事会成员的票数总和还多1票，从而实际上拥有完全控制权。但无论你在董事会层面如何“创新”，一旦你接受了风险投资，为了产生风投规模的回报而进行的大规模商业化，迟早是会被期待的。

DeepSeek没有任何这些预期。因此，它没有商业模式，也不需要商业模式。通往AGI的道路需要算力、人才，以及相当剂量的良好研究品味。没人规定它必须需要一个商业模式。

02 钱多麻烦多，没钱没烦恼

当然，筹集更多资金最常见的理由是为了购买更多的算力来支持研究。然而，并不显见的是，要产出好的研究成果，更多的算力总是必要的。

这一洞察并非DeepSeek那独特的自筹资金架构所独有。Ilya Sutskever，这位可以说是拥有最佳研究品味的AI研究员，也表示同意。他在Dwarkesh播客中用自己的话说道：

“算力规模已经足够大，以至于并不显见你需要那么多额外的算力来证明某个想法。我给你打个比方。AlexNet是建立在两块GPU上的。那是用于它的总算力。Transformer是建立在8到64块GPU上的。2017年没有哪篇Transformer论文的实验使用了超过64块GPU，这相当于什么，今天的两块GPU？ResNet也是如此，对吧？你可以争辩说，o1推理模型（o1 reasoning）并不是世界上最耗算力的东西。

因此，对于研究来说，你绝对需要一定量的算力，但远非显而易见的是，你需要绝对最大量的算力来进行研究。”

另一方面，通过消除外部资金的附带条件，以及“仅仅因为有钱就必须购买更多算力”的必要性，两种组织层面的优势显现出来。而DeepSeek两者兼备。

首先，即使资源更加有限，内部也不存在资源竞争。这里没有官僚主义、内斗、权力斗争，也没有为了决定GPU是应该支持新产品发布、扩展现有流行服务的推理需求，还是分配给一个新的研究想法而进行的利益交换。在一个没有外部资金、没有商业模式的小型实验室里，良好的研究品味和新想法可以得到最大程度的支持和拥抱，即使绝对层面上的总算力是有限的。

其次，基于薪酬、津贴或团队获得的算力多少而产生的嫉妒和等级秩序更少，而这些往往是有毒的，却根植于人性之中。你的组织瞬间变得扁平，并且可以保持扁平。伴随外部资金而来的不仅是商业模式的期望，还有估值、股票期权，以及一个高估值AI实验室所有的浮华装饰，无论这种估值在早期是多么没有意义。来自梦幻估值的纸面财富往往会让位于膨胀的自我价值感、嫉妒，以及被资金更雄厚的竞争对手挖角。这些浮华装饰不仅仅关乎个人财富创造，还与实验室的品牌、声望和吸引更多人才的魅力捆绑在一起。而这些装饰可能会变得相当荒谬，比如该实验室办公室健身房里那些印有“Thinking Machines”品牌的杠铃片：

DeepSeek有自己的健身房吗？我不知道。可能有。但我很确定它没有印着品牌的杠铃片。Ilya Sutskever是否希望他能像梁文锋一样自筹资金来运营SSI（迄今已筹集30亿美元）？可能吧。他可能拥有最好的直觉和研究品味，但他无法阻止挖角者——甚至他的联合创始人CEO也被Meta财力更雄厚的扎克伯格挖走了。这并不是说DeepSeek对挖角免疫。其明星研究员之一罗福莉，现在正领导着财力更雄厚的雷军旗下小米的AI工作。

在一个被金钱淹没的行业，以及金钱总是带来的阴谋和戏剧性中，DeepSeek因零外部资金而导致的商业模式缺失，是其唯一持久优势的源泉：为服务于AGI研究而实现的内部最大化对齐，别无其他。

我甚至不确定我是否相信AGI。但作为一名投资者和资本家，我很乐意进入DeepSeek的股东名册。话虽如此，如果DeepSeek曾经让我或任何外部投资者进入，那么让DeepSeek之所以成为DeepSeek的特质，将彻底毁掉，不复存在。

来源：36kr

时间: 2026-1-20 08:20

作者: 为别人打工的人

通信人家园 (https://www.txrjy.com/)