通信人家园

标题: 还傻傻分不清AI Agent和Agentic AI?康奈尔大学最新综述来了,一文读懂  [查看完整版帖子] [打印本页]

时间:  2025-5-29 14:02
作者: ttxx     标题: 还傻傻分不清AI Agent和Agentic AI?康奈尔大学最新综述来了,一文读懂


几年前,我们还在讨论“AI 到底有什么用”,可到了 2025 年,AI Agent 已经可以自动感知环境、拆解任务、并灵活应对变化;与此同时,Agentic AI 又一次将“协作”提到新高度,让多个小团队般的 Agent 分工协作,共同实现“更高层次的目标”。

这两个概念最近异常火热,但在日常讨论或媒体稿件中,往往被混为一谈。

你可能经常看到——“2025 年是 Agent 爆发之年”、“这两天微软、谷歌都在密谈 Agent 技术”、或是“Gartner 将 Agentic AI 列为 2025 年十大技术趋势之一”。当我们被这些预测震撼时,不免要问:AI Agent和 Agentic AI 之间又有着怎样的本质差别?

来自康奈尔大学的研究团队及其合作者在一篇题为AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges的综述中,从定义、特征、架构、应用场景以及挑战与解决方案等多个维度,拆解了两者的核心内涵和技术边界。



这项工作旨在为开发鲁棒、可扩展和可解释的 AI Agent 和 Agentic AI 驱动的系统提供明确的路线图。

定义

首先,AI Agent 和 Agentic AI 在定义等基本方面上存在明显不同。

AI Agent 是一种自主软件实体,专为在限定的数字环境中执行目标导向的任务而设计。这些 Agent 能够感知结构化或非结构化的输入,基于上下文信息进行推理,并采取行动以实现特定目标,通常作为人类用户或子系统的替代品。与遵循确定性工作流程的传统自动化脚本不同,AI Agent 具备响应式智能和有限的适应性,能够解读动态输入并相应地调整输出。

如下图,AI Agent 在架构分类和实际部署中具有三大基础特征:自主性、任务专一性以及反应性与适应性。



图|AI Agent 的核心特征——自主性、任务专一性和响应性。


其中,自主性指的是 Agent 在部署后能够独立行动,减少对人工干预的依赖,从而实现大规模的无人值守运行。这使得 AI Agent 能够在持续监督不切实际的应用场景中实现可扩展的部署,例如客户服务机器人或日程助手。

任务专一性则体现了 AI Agent 能够在特定功能领域(如日程安排、查询或过滤)内实现高性能优化。这使得 AI Agent 在自动化任务中高效、可解释、高精度运行,尤其是在通用推理不必要的场景中。

响应性是指 Agent 能够响应其环境(包括用户指令、软件状态或 API 响应)变化;当进一步结合适应性时,一些系统还通过反馈循环、启发式方法或更新上下文缓冲区等方式,整合了基础的学习机制,以在个性化推荐或对话流程管理等场景中逐步优化行为。

与 AI Agent 不同,Agentic AI 是一种新兴的智能架构,其利用多个专业化 Agent 协作来实现复杂且高层次的目标。这些系统由模块化的 Agent 组成,每个 Agent 负责更广泛目标的一个独特子组件,并通过集中式协调器或去中心化协议进行协调。这种结构标志着从单一 Agent 架构中通常观察到的原子化、响应式行为的概念转变,转向为一种以动态 Agent 间协作为特征的系统级智能形式。

这一范式的关键推动因素是目标分解,即规划 Agent 自动解析用户指定的目标,并划分为更小、更易于管理的任务。这些子任务随后被分配到 Agent 网络中。多步推理和规划机制促进了这些子任务的动态排序,使系统能够实时适应环境变化或部分任务失败。这确保了即使在不确定性条件下,也能鲁棒地执行任务。

同时,不同 Agent 通过分布式通信渠道通信,例如异步消息队列、共享内存缓冲区或中间输出交换,从而实现无需持续集中监督的协调。

此外,反思性推理和记忆系统使 Agent 能够在多次交互中存储上下文,评估过去的决策,并迭代优化其策略。这些能力共同使得具身 AI 系统能够展现出灵活、适应性强且协作的智能,超越了单个 Agent 的操作限制。

研究团队通过智能家居系统案例阐释了 AI Agent 和 Agentic AI 之间的区别。



图|AI Agent 与 Agentic AI 在概念上的对比。


如上图所示,左侧展示了一个传统的 AI Agent,即智能恒温器。它接收用户设定的温度值,并自主控制加热或冷却系统以维持目标温度。虽然它能够表现出一定的自主性,比如学习用户的作息时间或在无人时减少能耗,但它仅在孤立状态下运行,执行单一且明确的任务,而不涉及更广泛的环境协调或目标推断。

相比之下,右侧则展示了一个嵌入智能家居生态系统中的 Agentic AI 系统——多个专业化 Agent 协同互动,管理诸如天气预测、日常安排、能源定价优化、安全监控以及备用电源激活等多种功能。它们不仅仅是响应式模块,还可以动态通信、共享记忆状态,并协同实现高层次系统目标,如实时优化舒适性、安全性和能源效率等。例如,天气预测 Agent 可能会发出热浪预警,能源管理 Agent 则会协调使用太阳能提前预冷,以避免高峰时段的高电价。同时,Agentic AI 系统还可能在无人时推迟高能耗任务或激活监控系统,实现跨领域的决策整合。

应用

另外,AI Agent 和 Agentic AI 在应用场景方面也存在不同。如下:

AIAgent:


Agentic AI:




图 | AI Agents 和 Agentic AI 在八个核心功能领域的分类应用。


挑战与局限

此外,AI Agent 和 Agentic AI 面临的挑战也不同。

AI Agent 在利用 LLM 和工具使用接口自动化结构化任务方面,存在可靠性差、泛化能力不足和长期自主性弱等问题。这些挑战既源于其对静态预训练模型的依赖,也在于其难以具备因果推理、规划和鲁棒适应等 Agent 特性,主要分为以下 5 点:


尽管多 Agent 架构使得自动化的目标更加宏大,但它为 Agentic AI 系统带来了一系列放大和全新的挑战,这些挑战加剧了基于 LLM 的单个 Agent 所固有的局限性,具体如下:


解决方案与未来展望

基于以上 AI Agent 和 Agentic AI 暴露出的问题,研究团队提出了多项改进策略:

检索增强生成(RAG):通过将用户查询与向量数据库(如 FAISS、Pinecone)语义匹配,AI Agent 可实时引用外部信息,减少幻觉生成。对于 Agentic AI 系统,统一的检索生成流水线可为各子 Agent 提供共享记忆,提升一致性与抗误导能力。

工具化增强推理(Function Calling):Agent 可调用 API、执行脚本或查询数据库,实现动态感知与任务执行,如天气查询、日程安排、运行代码等。多 Agent 协作中,借助函数接口实现职责分工与有序衔接。

Agentic 循环(ReAct Loop):将“推理→执行→观察”构成闭环,Agent 在每次调用工具或 API 后,先对结果进行验证,再进行下一步推理,从而在单次任务中反复校正、持续纠错。多 Agent 场景下,需要基于共享日志和统一的反馈机制,将各自的观察结果汇聚、对齐,确保系统整体的反思能力不分裂。

多层次记忆架构:包括情景记忆(记录交互过程和反馈)、语义记忆(保存结构化领域知识)与向量记忆(支持相似度检索);在多 Agent 系统中,各 Agent 可维护本地记忆并访问共享全局记忆,实现跨任务的连续性、个性化和长期规划。

多角色协同:为应对复杂任务,系统引入策划者、摘要者、审校者等专精角色,由元 Agent 协调,提升可扩展性与容错能力。

反思与自我批评机制:Agent 完成初步输出后,利用二次推理流程对自身结果进行审视和验证。在 Agentic AI 中,可让“审核者”Agent 专门对其他 Agent 的成果进行交叉检查,实现协作式质量把关,促进系统在迭代中不断自我优化。

程序化提示工程:避免手工调参带来的不可复现和脆弱性,通过代码化的任务模板、上下文填充器及检索变量,动态生成结构化提示。各角色 Agent 统一使用此流水线,确保消息格式、依赖追踪和语义对齐的一致性,杜绝多 Agent 协作中的“提示漂移”现象。

因果建模与模拟规划:将因果推断嵌入 Agent 推理,使其能够区分关联与因果、进行干预模拟。例如在供应链场景中,Agent 可预测延迟对下游节点的因果影响。在多 Agent 协调时,通过 STRIPS 或 PDDL 等规划语言,明确定义行动的前置条件和效果,实现更安全、更可靠的协作。

监控、审计与可解释性:记录提示、工具调用、记忆更新和输出日志,为事后分析与故障排查提供依据。多 Agent 环境下,串联各 Agent 的审计痕迹和对话重放,帮助开发者迅速定位错误源头,并通过可视化管道提高系统透明度。

治理感知架构:通过访问控制、沙箱机制与身份管理,实现决策可控与行为可追溯。多 Agent 系统中,凭借责任归属和合规检查,构建可信的 AI 生态,降低在医疗、金融等敏感领域的应用风险。

最后,研究团队还提出了 AI Agent 和 Agentic AI 的未来发展路线图。



图|AI Agent 和AgenticAI 的未来路线图


AI Agents 将在五个关键领域实现突破:主动推理、工具集成、因果推理、持续学习与可信操作。

首个重要转变是从被动响应向主动智能迈进。Agent 将基于模式、上下文或潜在目标主动发起任务,并能动态接入数据库、API 等系统以完成复杂任务。因果推理的发展也至关重要,使 Agent 能理解因果关系,从而更好地支持诊断、规划和预测。为保持适应性,Agent 需具备持续学习能力,借助反馈和情境记忆不断调整行为。这些能力将推动 Agent 从静态工具演变为具备自主性和可控性的认知系统。

Agentic AI 是在此基础上的自然延伸,强调多 Agent 协作、上下文持久化和任务编排。未来系统将支持多 Agent 并行协作,类似人类团队,通过协调层分配角色、管理依赖关系并解决冲突。持久记忆架构将保障长任务协调和状态感知。模拟规划也将成为核心能力,帮助 Agent 在执行前测试策略、预测结果并优化行为。同时,伦理治理框架将确保 Agent 网络的责任归属与价值对齐。各行业也将涌现出领域专用系统,利用上下文知识实现比通用 Agent 更强的能力。

研究团队还提到了清华大学黄高教授团队提出的新型学习范式 AZR(arXiv:2505.03335),该研究使 AI 不再依赖外部数据,而通过自主生成、验证与解决任务实现自我进化,借助如代码执行等可验证机制推动学习。这为在数据稀缺环境中实现真正自主、可适应的推理 Agent 提供了可能。



结合 AZR,多个专用 Agent 可在协调工作流中共同进化。例如,科学研究可由提出假设、模拟实验、验证结果、调整策略的 Agent 自动完成,完全通过自我博弈与可验证推理,无需持续人工介入。研究团队认为,AZR 为 AI Agent 和 Agentic AI 向下一代 AI 的转变奠定了基础。


来源:36kr

时间:  2025-5-29 16:31
作者: 不吹不黑

一文读懂!




通信人家园 (https://www.txrjy.com/) Powered by C114