通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  大校

注册:2015-11-1416
跳转到指定楼层
1#
发表于 2026-1-12 15:06:40 |只看该作者 |倒序浏览
1

GPT-4 正式发布后,引发全球轰动。对我而言,那是我第一次意识到,大模型已经具备超越人类理性思维的能力。我随即一口气发布了多篇评测文章,开设了新课程,研发了新产品。

而两年后,奥特曼却带头致信美国政府,呼吁限制 DeepSeek。自逼宫事件以来,OpenAI 团队几乎未曾推出令人瞩目的重大成果。目前,开源社区普遍认为,开源大模型在多个维度上已实质性超越闭源大模型。

道心惟微,人心惟危。越是得意之时,越应警惕潜藏于管理团队「人性系统」中的隐性风险。 OpenAI团队的发展,真可谓「成也奥特曼,败也奥特曼」。

2

有时候真的很佩服工程师们。

对于认知科学家来说,模型更像是一种抽象的架构。无论是西蒙还是辛顿,他们提出的模型,多是一些简单的程序,甚至称不上真正的程序。有时候,认知科学家所构建的模型,仅仅是一个抽象的图示而已。

然而,工程师们却将这些模型付诸实现,发展出一种独特的生态和文化。

2024 年,我在演讲《站在 3000 年繁荣的起点》中提到,未来的时代将属于模型家

科学家的工作成果是实验与论文,而模型家的工作成果则是模型与代码。

未来,不具备生产模型与代码能力的组织,将逐步落伍,最终被淘汰。

同样,那些看不懂模型与代码的个人,也将如同20世纪看不懂科学实验与论文的人,只能逐渐沦为研究工作中的边缘角色。

3

从这轮 AI 大变革来看,最突出的变化就是模型成为了生产要素。

我在 2023 年跨年演讲《人生发展的道与器》中,有一句金句:对话即生产。这是新时代有别于信息时代的地方:信息时代强调「媒介即信息」,而新时代则是「对话即生产」。

而今天我要说,模型即生产要素。它的格式、架构、封装、修改、生成与应用,这一切共同构成了未来至关重要的命题。

「模型即生产要素」对人类社会而言,最特殊之处在于,我们的所思所想所行,乃至过往的创作,都可以被固化为模型,并被更多人调用与使用。

辛顿在接受采访时举的例子非常精彩:我们难以理解一个人的内在偏见,但却可以相对容易地量化一个模型的偏见,并据此进行调整。

这就是这轮AI大变革的独特之处。

4

AI 时代来临,有三个职业依然较难被取代:教师、咨询师,以及医师、理疗师、按摩师。

这三个职业很有趣,源于人类固有的局限

教师:由于人的行为具有自反性,因此需要教师营造氛围,激发学习者的内在驱动力。

咨询师:人的内心世界极为复杂,存在大量不可言喻、甚至难以启齿的隐秘内容。这些内容往往难以用语言完整表达,而更多通过肢体动作与整体感受来传达。

医师、理疗师、按摩师:源于对人体的处理。人体是一个复杂系统,而治疗的容错率却极低,因此,有经验的专业人士显得尤为重要。

5

AI 时代之前,我们可能是这样的:

设计不会,就雇佣一位设计师;编程不会,再雇佣三位工程师:前端、后端、算法。为了管理大家,再雇佣一位产品经理。为了卖掉产品,又雇佣三位运营人员,分别负责内容、社群和渠道,还需要再雇佣一位运营经理来管理他们。

但如今,趋势已经发生变化,开始变成这样:

这也不会?那就试试看第一个 AI 大模型是否能做到;那也不会?再试试第二个 AI 大模型是否可以胜任。为了进一步提高效率,还可以让第三个 AI 大模型编写一个代理程序来协调它们的运行。如果市面上的大模型都无法满足自身的特定需求,那么就可以自己动手,利用 AI 大模型训练一个新的 AI 模型,甚至连训练数据也部分源自 AI 生成。

未来三年,基于 AI 的各类软件与科研成果都将呈现井喷式增长。

这将对社会形态产生巨大冲击,同时也会带来一些红利。

6

知识可以分为 2023 年之前和 2023 年之后。

2023 年之前的知识,是尚未受到 AI 污染的知识。

2023 年之后的知识,几乎都受到了 AI 的污染。今天看到一篇新闻,令人哭笑不得:一家报道 AI 的专业媒体为了蹭热点,写了一篇关于浙大毕业投资人的报道,结果把张磊写成了浙大本科毕业……众所周知,他是中国人民大学毕业的。记者为何会出现这类低级错误?因为那份名单显然是由 AI 生成的。

与我协作的任何人,我都会用一个指标来判断其是否靠谱:稿件的第一版是否直接由 AI 生成?

如果对方是这样做的,我几乎不会再与其在文字上进行任何协作。

放弃亲自撰写稿件的第一版,实际上就是放弃了独立思考的能力。

借用我之前的那个比喻:写作之难在于:先「怀孕」,再等孩子出生、长大成人,最后才谈得上为其拍照并使用美颜滤镜。很多人误以为,AI 不仅能完成「怀孕」,还能帮助孩子成长成人,这种想法实属荒谬。

这无异于放弃了持续提升自身能力的可能性。

7

非AI领域的人,理解大模型,其实最难的是一个思维方式的切换,如何从思想实验、实验科学到符号思考、计算模拟这类思维方式。

8

AI 发展 2 年,我之前的预判基本对了:在 AI Coding 与 AI Science领域取得了极大的进展,创造了几个新的万亿美金市场。

但说实在的,我虽然已经预判了一些新趋势、新技术的涌现,但有些成果,还是超出我的预期了,给我也有惊喜、惊艳的感觉了。

AI Coding 更像是数字世界的元方法、元技能。类似人类世界,我们都得掌握听说读写,才好沟通。

同样,在数字世界,我们都得掌握:CRUD 实体的能力。互联网+移动互联网时代,一个程序员一天最多能 CRUD 30 个实体,算是极限了,对数字世界中的 object 操作。并且这种能力仅限程序员。

而 AI Coding 带来的变革,是任何一个受过高等教育的普通人,未来,甚至任何一个识字的人,即可用 AI 工具,CRUD 几百个、几千个实体,并且呈现出实体之间的关系,成为最终软件。

而AI Science这块,我个人感觉,一方面,更多借助于AI Coding的进步;另一方面,其实在于它对人类理性思维的漏洞以及想象力不足的弥补。

9

在 AI 时代之前,某类技术知识的半衰期一般会有 3-10 年左右,而现在,普遍变为 18 个月到 3 年了。

对一个人的学习能力要求变高了,对一个人的认知能力要求也变高了。

相应地,处理技术琐事的时间变少了,死记硬背的能力要求变低了。

10

今天傍晚,我出去在公园跑步时,有个很大的感触是,可能 AI 时代,心理学变得更重要了。但我所说的心理学,可能并不是指现在陈腐的那套心理学。而是类似这些:

1、认知:人类如何更好地约束自己给 AI 的指令,以降低认知复杂度?

2、情绪:人类如何更好地帮助 AI 理解人类所处的上下文或情境?

3、动机:人类如何微调 AI 的权重,增强爱或效率?

4、行动:人类如何更好地配合 AI 的行动?

5、人格:人类如何更好地理解不同 AI 大模型的人格?

6、社会:人类如何更好地理解 AI 智能体、AI 大模型等构成的新社会共同体?

传统心理学,人类为中心,其他生物为辅助,因为其他生物统统很难理解人类的意向性,所以,传统哲学说人类是宇宙间孤独的生物。

但现在很不一样了,通过工程学的手段,如 SFT,以及大规模语料的预处理,其实,AI 大模型内置了部分人类意向性,至少可以极为流畅地对话。某种意义上,它已经就是智能体了。

这样,新一代心理学,将逐步从人类为中心,过渡为,既包括人类为中心的那部分心理学,还包括 AI 大模型为中心的那部分心理学,以及人智协同的那部分心理学。

在 AI 大模型时代之前,心理学其实是一个蛮虚的学科,改善人类的认知、改善人类的情绪,给单个人与整个社会带来的好处有限,甚至,心理学家自己鼓吹的改善成功的各类方法,往往并没那么成功,常常是吹牛而已。

但,到了 AI 大模型时代,很不一样了,认知即现实。

改善了某个 AI 大模型的认知、情绪,等,那么,立即带来的是整个人类生产力的大跃迁。

类似Anthropic、notion这类发展速度很快的AI公司,其实雇佣了不少心理学博士。

11

Anthropic 实际上定义了三个与「人类知识结构」强相关的概念:Project、MCP, Skills.

这句话极为关键,project其实就是提供了上下文、约束了输入输出边界;而agent其实提供了行动主体,约束了行动边界;skills则提供了验证标准或范例,约束了能力边界;mcp则提供了模型与外部事物间的通信方式,约束了模型的吞吐量。

12

时代,其实在发生巨大变迁了。知识工作,可以提速 10 倍、30 倍、100 倍了。

只是,很多人感知不到。而 AI Coding 领域,普遍达成共识了:至少是 10 倍速了。

为何恰恰、正好、首先,AI 提速,发生在【AI Coding】领域,其实是多种合力:

1、Github 上沉淀了太多代码、数据、内隐知识;

2、不同领域的主流开发框架,相对容易整理出来;

3、程序开发,结果容易验证;

4、大语言模型本来就擅长处理复杂文本,而 code 就是一种典型的复杂文本;

5、将近 1000 亿美金的投入,大量人工标注,大量合成数据,导致将【AI Coding】不断推向新的里程碑。

6、程序员本身是接受新鲜事物最快、最舍得给生产力工具投资的人群。

13

Agents 这个词,其实是个与时俱进、抽象的实体(object),而不要将它理解为一个静态的、具体的实例(instance)。

举个例子,2023 年的时候,业界普遍地将 Agents 理解为,撰写不同提示词,就算一个 Agents 了,类似这类写法:假设你现在是一个作家。

2024 年的时候,业界开始给 Agents 加入了一些东西,普遍支持联网检索了,RAG 开始大规模普及。流行的,与某个 PDF 对话,以及联网搜索,知识库回答,就成了 2024 年的 Agents 了。

然而,到了 2025 年的时候,大家才发现,Agents 还需要加入 MCP、Project、Skills 以及更多脚本、全局规则、知识库、记忆库等等。

那么,2026 年的时候,Agents 又会加入什么呢?

所以,不要将 Agents 看得太神秘,严格来说,它受制于四个东西:

1、LLM 端的优化:大模型本身的多跳推理支持能力,跳跃步骤越多,支持的 Agents 能力就越强;

2、Prompt 端的优化:提示词工程,或者上下文工程,其实都是一个意思;

3、MCP 端的优化:各类 MCP 能被大模型更好地理解,并且提供更充分的报错信息、反馈信息;

4、知识库端的优化:知识库其实远远不止是文件类知识库,更包括各类全局规则、项目上下文信息,有的称之为 Project,有的称之为 Skills,以及各类记忆库,有的称之为 MemoBank,但总的来说,就是提供更多信息的。

最后才轮到Agents端的优化:也就是设计多个Agents,如何让它们相互对抗、相互协作,以及相互之间如何调度?

14

现在,真的是新工作时代来临了。以前有个术语:数字素养,对应数字鸿沟。现在,开始多了个新鸿沟:认知鸿沟。AI 放大了。工作效率在 AI 加持下,开始出现了显著鸿沟。

未来,无数领域,10倍速的工作效率将不再遥远,正如同今天AI Coding领域正在发生的现实一样。

15

两年了,AI 大模型带来的实质性生产力跃迁,首先发生在 AI Coding 领域,真的有一种:情理之中,但事先普遍没有被预估到的感觉。之前,人们更多谈的是,AI 对制图、音视频、个人创作的颠覆。但这些领域,因为个人的情感价值太大,所以短期内,还谈不上颠覆。

而,AI Coding 领域的跃迁,是实实在在的,生产力跃迁了。

这轮跃迁的三个关键时间节点:2025年5月、8月、10月。如今,则轮到国内大规模跟进了。

而我更期待的是,当【认知能力】与【AI能力】结合在一起,还可能产生一些什么令人完全想不到的东西?毕竟,【认知即现实】。毕竟,我的【认知能力】以及【开智生态】对如何提高一个人的【认知能力】的研究,我估计是非常领先的。

16

这一轮 AI 生产力变革冲击,极为巨大且底层,大家务必重视。目前我已经明确预判:是一种极为猛烈且底层的冲击。

举个例子,教育,马上就会被改变。技能书可以加载复杂知识了。那么,如何写好技能书就比如何学习具体领域的复杂知识更重要了。

设想一下,当无数复杂技能都被外化为技能书了。之前那么多白领高薪岗位还有必要存在吗?

现在只局限在技术圈,但普及到大众层面很容易,只是一个时间问题。

17

AI 时代,品味的重要性被提高到无与伦比的位置了。简单来说,它就是一种挑剔,一般人 80 分能忍,但品味好的人,在 80 分之上,还能感受到 8000 分、8 万分的存在。他会觉得,你怎么能忍受这样的垃圾?

在 AI 时代之前,品味好的人,很多时候,不得不容忍平庸的事物的存在。但今天非常不一样了。

今天,平庸的事物,拖累的是整个【混合智能】迭代的速度。也就是,原本能够较快时间达到下一个里程碑,却不得不在什么反复对齐【80分】的水准。

18

我发现,这轮 AI 变革,有的人适应快,有的人半天没适应,没搞懂,而适应快的人往往就是所谓的【编程思维】【计算思维】好,明白如何更好的与 AI 沟通。

而所谓的【编程思维】【计算思维】好,关键都在【数据】与【接口】这里。

19

AI 时代,最怕的是:不知道自己不知道。

AI 快速发展,会超出我们所有的人的想象。这个时候,不给自己任何预设,更不要假装风淡云轻(这是无数 AI 公司 CEO 的典型错误)。亲自下场写代码、亲自下场调试大模型,亲自下场了解技术最新动向,这才是最有意义的行为。

最近,我实际耗了30 亿 token,有些判断,自然会被推翻;有些判断,自然会被修正;有些判断,自然会被验证是正确的。而我真正能保留下来的,自然是更好的认知。

20

很多同学刚开始面对活水插件(42plugin)为代表的这类全新 AI 工作流,不知道如何下手,我告诉你,答案是非常正确的。因为,无数硅谷 AI 老将都不知道如何下手。

这是一套全新的工作流,一套全新的打法,一套全新的心智抽象层,需要我们去适应 AI 大模型,而不是 AI 来适应我们。

21

意向是一种生命的奇迹,让生命关心世界。5000 年来,人类用文字、印刷、电波,放大这份关心的半径。今天,我们创造了新的放大器:AI 大模型。你的信念、你的欲望、你的意图,将在 AI 的增强下,抵达从未想象的远方。

1956 年,计算机作为参照物催生了认知革命,核心隐喻是「心智=信息处理系统」。2026 年,AI 大模型作为参照物催生意向革命,核心隐喻是「心智=意向网络系统」。计算隐喻时代的问题是记忆如何存储、注意如何分配、语言如何处理;意向隐喻时代的新问题是意向如何涌现、理解如何发生、人机意向如何融合。

站在意向革命的起点,带着好奇与热情,与 AI 一起看见更大的世界。

22

从我的观察、实际体验来说,

1.2 倍速工作:采取 cc+42plugin+zed,绝大多数人可以做到提速 1.2 倍到1.5 倍左右,开一个 agent;

3 倍速工作:开 2-4 个 agent,以及懂软件开发,需要平时有较好的工作习惯,尤其是复盘类习惯,逻辑思维清晰,目前,少数人可以做到;

10 倍速工作;开 4-10 个 agent,用的是国际上最好的 opus4.5 模型,平时工作习惯非常好,是开源社区的领导者、组织者或技术类公司的负责人,以及精通 worktree 类不太常见的 git 类命令,目前,估计只有极少数人可以做到。

倍速越高,对一个人的认知能力、技术能力、领导能力要求越高。为何领导能力也这么重要?其实,10 倍速,很多时候就是在协调、组织 agent 了。

但再过18个月、3年,门槛会越来越低,实现3倍速的工作效率,越来越容易。


来源:36kr

举报本楼

您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2026-1-12 18:35 , Processed in 0.254876 second(s), 16 queries , Gzip On.

Copyright © 1999-2025 C114 All Rights Reserved

Discuz Licensed

回顶部