孙鑫提到,目前国内的AI Agent正处于一个顶峰点,未来两到五年,AI Agent可能进入生产的成熟期,但目前企业对于AI Agent 的探索还应保持相对谨慎的态度,技术瓶颈、可靠性、成本、场景适用性仍是重要的制约;Deep Seek 拉平了很多企业在应用大模型技术上的差距,但企业更应考虑的是让自身数据与大模型产生协同效应,让大模型为自己所用;在谈及如何衡量 AI 投入的 ROI 时,孙鑫提到了效率、质量、财务和安全四个维度。
“Agent Washing” :热闹背后的理性思考
崔强:今天聊一个大家比较关注的话题:真假 AI Agent,到底是贴牌陷阱,还是一个技术泡沫?今晚的嘉宾是Gartner公司副总裁孙鑫。今晚的话题,也源于Gartner 的一篇文章,文章题目是「Gartner: 警惕 “Agent Washing” ,辨别炒作与实质」。
Agent到底是不是新瓶装旧酒?这在国内外都是一个很常见的问题。针对这一问题,Gartner给出了一个非常严苛的AI Agent定义标准。在Gartner眼中,到底什么才是真正的AIAgent?怎样定义企业级的 AI Agent?目前 Salesforce以及国内很多厂商也都推出了 AI Agent 产品,这些产品到底算不算AI Agent?今天晚上我们就聊一下这个话题。请孙总先介绍一下自己,然后介绍一下写这篇文章的背景。
孙鑫:好的,谢谢崔老师。我叫孙鑫,大家可能更熟悉我另外一个名字Julian。我就职于Gartner,Gartner是一家美国研究型咨询机构,专门服务于全球的首席信息官,即 CIO 以及他们的团队,包括大数据主管,以及企业的 AI 一号位等人群。我主要负责Gartner中国区的研究团队,主要研究方向是人工智能和数据分析。
这篇文章来源于美国人常说的一个词: “FOMO”(错失恐惧症,Fear of Missing Out),意思是企业或者个人害怕忘记了(错过了)什么事情,实际上这样的事经常发生。比如很多年以来,国内非常多的厂商都称自己为某某云(Cloud),再往前几年是某某中台,十几个月之前是某某GPT,到了今天可能就是某某 Agent。
AI 产品比较有意思,它服务的更多是 Prosumer用户(参与生产的消费者),而不是一般的 Consumer 用户(消费者用户),它相对于专业型消费者用户是有触达力的。所以一旦厂商把名字改成Agent,就会极大地吸引一些 to C 端比较喜欢钻研新产品的用户尝试。很多厂商的产品,在几个月前叫某某Copilot,之后又改成某某 Agent。
我认为,目前生成式AI正处于期望膨胀期,国内的Agent正处于一个顶峰点,大家期望非常高,甚至有些厂商宣称做出了通用的 AI Agent,但实际上这件事是不太可能的;之后有些技术会进入到泡沫破裂的低谷期,从最高点跌落到最低点,再逐渐进入一个稳步爬升的复苏期。随着新技术的融入,以及更多商业化方法论和工具的实现,最终达到成熟期。
(图源Gartner网站)
每一个阶段,我们都会给予客户一定指导,评估技术投入策略。在我们对 AI Agent的技术成熟度曲线中,对它有一个benefit(有益性)评级是非常高的。
第二,它是一个软件实体,而非一个大模型。这个软件实体将 AI 组件放入其中,但最终的执行仍然是在软件层进行协调的,也就是说最终干活的仍然是该软件实体。
第三,提到使用 AI 技术,AI Agent,并不是必须且只有大语言模型才能被称为 AI Agent。大模型出现以前,已经有非常多的企业尝试用 Agent 方式去做一些工作,比如用更传统的机器学习,或者用符号 AI (symbolic AI) 的方式去做 Agent,使结果更可预知、更稳定,甚至通过代码来实现一些工作,这仍然是可以被称为 AI Agent。
AI Agent要用人工智能技术进行感知,获取外界信息,这种感知能力可能是目前技术上一个较大的瓶颈,因为外界环境很可能必须在统一的流程中,甚至在统一的云平台、大厂环境中,才能更好地协调。
第四,要做出决策, AI Agent 可能会调用不一样的功能制定行动计划,做出一些决策。 第五,采取行动,要把活给干了。我们要用 Agent 把一些工具、接口、技能和功能调用起来,对目标环境产生影响。