通信人家园
标题:
企业AI Agent如此困难的真正原因并不是人工智能
[查看完整版帖子]
[打印本页]
时间:
2025-10-9 12:07
作者:
see122
标题:
企业AI Agent如此困难的真正原因并不是人工智能
演示让 AI Agent 看起来毫不费力。但真正的痛苦始于演示之后 , 当 AI 代理、工作流程、遗留系统和评估开始发挥作用时。
为什么现在这很重要
智能助理随处可见。演示视频充斥着 各大流行媒体 。供应商承诺推出“自动 辅助 驾驶”,让你在喝拿铁咖啡的同时就能管理你的整个部门。而且,说实话,这些原型相当不错。
但如果你曾经尝试过从
幻灯片到实际生产
,你就会知道:人工智能并非最难的部分。模型正在快速改进,调用 API 也并非火箭科学。真正的障碍来自更古老、更复杂、更深刻的人性。
当企业在代理上 遇到阻碍 时,他们会遇到以下困境:
到处都能看到 AI Agent (这不该 是AI 的事)。
定义 什么 应该自动化(工作流程清晰)。
与现有系统 (遗留系统和 API)集成。
证明其可靠运行(评估和监控)。
让我们来分析一下。
真正困难的是什么
架构、框架、内存、多模态和实时性都很重要。这些都很重要 ! 但与三大难题相比,这些都是可以解决的工程问题。
混乱源于人员、流程和老旧基础设施的协调。这正是企业项目成败的关键所在。
障碍#1— 随处可见的Agent(不该做的事)
首先,有一件事值得大声说出来:
你不需要到处都使用 Agentic 系统。
事实上,许多企业问题可以用更简单、更稳固的方法更好地解决:
经典代码
——如果流程重复且定义明确,则脚本或服务将比代理运行得更快、更便宜、更可靠。
传统机器学习
——当任务是关于结构化数据的预测时,回归或分类器通常优于推理循环。
图形界面和工作流引擎
——有时真正需要的是清晰度和可用性;在 UI 中映射流程可以解决的不仅仅是增加自主性。
简单的 LLM 调用
——在很多情况下,几个精心提示的 API 调用即可提供所需的所 有“智能”,而无需编排开销。
代理最适合处理那些
复杂、多步骤、动态的工作流程
,因为灵活性至关重要。对于其他所有情况,选择合适的工具来完成任务可以避免额外的成本、脆弱性和集成难题。
障碍#2——工作流程定义(内容)
事实是:企业很少有清晰的工作流程。
流程存在于人们的头脑中。异常会不断累积。合规性会增加隐藏的步骤。当你问“客服人员到底应该处理什么?”时,你已经陷入了永无止境的会议、过时的规范以及诸如 “哦,但对于客户 X,我们的做法不同”之类的旁白之中。
这就是为什么
工作流程现代化
是 首要的 :
与企业坐在一起,绘制工作流程图,详细说明采取的每个行动、由谁执行以及手动程度如何。
阐明
什么可以实现自动化
、如何实现自动化 , 并非所有事物都需要 Agentic、
什么仍保持人性化
以及
它们如何相互关联
。
记录混乱的现实,展示工作流程并进行验证。
如果没有这些基础工作,您的代理人将会:
把错误的事情自动化。
使一半的事情自动化并停滞。
或者被那些本应帮助的人悄悄忽视。
障碍#3— 与现有系统的集成(方法)
一旦您知道要自动化 什么 ,您就会面临第 三 个障碍 : 集成到 已经存在的系统。
更糟糕的是——大多数系统在设计时根本没有考虑过代理。很多系统甚至在设计时都没有考虑过 API。
需要脆弱连接器的传统 ERP
。
具有半记录端点的
CRM 或票务系统。
十年前用框架编写的
内部应用程序现在已无人再触及。
身份验证方案、基于角色的访问、合规性限制。
后端系统的工作流程非常复杂,您需要 3 天的时间才能了解它的用途。
集成不仅仅是“连接到 API”。它还
涉及数十年的技术债务、所有权孤岛和脆弱的依赖关系。
这就是为什么一个在全新应用栈上顺利运行的演示代理在现实世界中突然崩溃的原因。它必须与多年来不断打补丁和定制的系统进行通信。
在企业现实中,集成等于:
查找遗留系统工作流程及其使用方法。
让系统专家来帮助我们(他们没有时间!)
在新旧数据格式之间进行转换。
处理速率限制和可靠性问题。
与 IT/安全团队协商访问权限(有时是最困难的部分)。
直到 越 过这 个障碍 ,代理才会停止,停留在原型循环中。
障碍#4— 评估(证明)
即使您确定了工作流程并成功完成集成,您仍会遇到第 四 个问题:
您如何知道它有效?
代理中的评估是出了名的不顺利:
任务级指标
:代理是否按照定义完成了工作流程?完成率是多少?误报率是多少?
代理级指标
:代理是否遵循工作流程并生成了正确的计划?我们是否捕获了所有流程中的错误并将其转交给人工处理?
业务指标
:它是否节省了时间、降低了成本或提高了准确性?
安全指标
:它是否避免了幻觉、违反政策、违反合规性,并且基本上没有做我们不希望它做的事情?
通常的机器学习技巧在基准数据集上提高准确率并不能解决问题。每个企业都有独特的需求。
这里的实用模式包括:
评估数据集
:精心挑选的输入以及预期的代理规划和输出。
真正的代理评估
:不仅评估结果,还评估代理计划和授权。
影子模式
: 代理 在完全控制人类之前与人类一起奔跑。
持续监控
:跟踪一段时间内的漂移、性能和回归。
如果没有严格评估,代理要么在演示中看起来很神奇,但在生产中却悄无声息地失败 , 或者更糟的是,他们会在无人注意的情况下破坏一些关键的东西。
结论——为什么AI代理在企业中会失败
让我们回顾一下。
企业代理最难的部分
不是人工智能本身
,而是:
代理幻影(不该做的事)
:在没有必要的地方随处看到 代理 。
清晰度(什么):
定义业务工作流程,在需要的地方进行现代化。
集成(方法):
插入遗留系统、脆弱的 API 和数十年的技术债务。
评估(证明):
不断评估代理以建立信任。
忽略这些,你的“ 自主 辅助 驾驶”就会一直困在原型的炼狱里。拥抱这些,你就能把人工智能从光鲜亮丽的演示变成企业级资产。
教训是什么?不要把代理的采用视为一个
人工智能项目
,而要将其视为一个
工作流程+集成现代化项目,
从第一天起就内置评估。
来源:36kr
时间:
2025-10-9 13:47
作者:
不吹不黑
那是什么?
时间:
2025-10-9 14:26
作者:
noahus
通信人家园 (https://www.txrjy.com/)
Powered by C114