通信人家园

标题: 还傻傻分不清AI Agent和Agentic AI？康奈尔大学最新综述来了，一文读懂 [查看完整版帖子] [打印本页]

时间: 2025-5-29 14:02

作者: ttxx 标题: 还傻傻分不清AI Agent和Agentic AI？康奈尔大学最新综述来了，一文读懂

几年前，我们还在讨论“AI 到底有什么用”，可到了 2025 年，AI Agent 已经可以自动感知环境、拆解任务、并灵活应对变化；与此同时，Agentic AI 又一次将“协作”提到新高度，让多个小团队般的 Agent 分工协作，共同实现“更高层次的目标”。

这两个概念最近异常火热，但在日常讨论或媒体稿件中，往往被混为一谈。

你可能经常看到——“2025 年是 Agent 爆发之年”、“这两天微软、谷歌都在密谈 Agent 技术”、或是“Gartner 将 Agentic AI 列为 2025 年十大技术趋势之一”。当我们被这些预测震撼时，不免要问：AI Agent和 Agentic AI 之间又有着怎样的本质差别？

来自康奈尔大学的研究团队及其合作者在一篇题为AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges的综述中，从定义、特征、架构、应用场景以及挑战与解决方案等多个维度，拆解了两者的核心内涵和技术边界。

这项工作旨在为开发鲁棒、可扩展和可解释的 AI Agent 和 Agentic AI 驱动的系统提供明确的路线图。

定义

首先，AI Agent 和 Agentic AI 在定义等基本方面上存在明显不同。

AI Agent 是一种自主软件实体，专为在限定的数字环境中执行目标导向的任务而设计。这些 Agent 能够感知结构化或非结构化的输入，基于上下文信息进行推理，并采取行动以实现特定目标，通常作为人类用户或子系统的替代品。与遵循确定性工作流程的传统自动化脚本不同，AI Agent 具备响应式智能和有限的适应性，能够解读动态输入并相应地调整输出。

如下图，AI Agent 在架构分类和实际部署中具有三大基础特征：自主性、任务专一性以及反应性与适应性。

图｜AI Agent 的核心特征——自主性、任务专一性和响应性。

其中，自主性指的是 Agent 在部署后能够独立行动，减少对人工干预的依赖，从而实现大规模的无人值守运行。这使得 AI Agent 能够在持续监督不切实际的应用场景中实现可扩展的部署，例如客户服务机器人或日程助手。

任务专一性则体现了 AI Agent 能够在特定功能领域（如日程安排、查询或过滤）内实现高性能优化。这使得 AI Agent 在自动化任务中高效、可解释、高精度运行，尤其是在通用推理不必要的场景中。

响应性是指 Agent 能够响应其环境（包括用户指令、软件状态或 API 响应）变化；当进一步结合适应性时，一些系统还通过反馈循环、启发式方法或更新上下文缓冲区等方式，整合了基础的学习机制，以在个性化推荐或对话流程管理等场景中逐步优化行为。

与 AI Agent 不同，Agentic AI 是一种新兴的智能架构，其利用多个专业化 Agent 协作来实现复杂且高层次的目标。这些系统由模块化的 Agent 组成，每个 Agent 负责更广泛目标的一个独特子组件，并通过集中式协调器或去中心化协议进行协调。这种结构标志着从单一 Agent 架构中通常观察到的原子化、响应式行为的概念转变，转向为一种以动态 Agent 间协作为特征的系统级智能形式。

这一范式的关键推动因素是目标分解，即规划 Agent 自动解析用户指定的目标，并划分为更小、更易于管理的任务。这些子任务随后被分配到 Agent 网络中。多步推理和规划机制促进了这些子任务的动态排序，使系统能够实时适应环境变化或部分任务失败。这确保了即使在不确定性条件下，也能鲁棒地执行任务。

同时，不同 Agent 通过分布式通信渠道通信，例如异步消息队列、共享内存缓冲区或中间输出交换，从而实现无需持续集中监督的协调。

此外，反思性推理和记忆系统使 Agent 能够在多次交互中存储上下文，评估过去的决策，并迭代优化其策略。这些能力共同使得具身 AI 系统能够展现出灵活、适应性强且协作的智能，超越了单个 Agent 的操作限制。

研究团队通过智能家居系统案例阐释了 AI Agent 和 Agentic AI 之间的区别。

图｜AI Agent 与 Agentic AI 在概念上的对比。

如上图所示，左侧展示了一个传统的 AI Agent，即智能恒温器。它接收用户设定的温度值，并自主控制加热或冷却系统以维持目标温度。虽然它能够表现出一定的自主性，比如学习用户的作息时间或在无人时减少能耗，但它仅在孤立状态下运行，执行单一且明确的任务，而不涉及更广泛的环境协调或目标推断。

相比之下，右侧则展示了一个嵌入智能家居生态系统中的 Agentic AI 系统——多个专业化 Agent 协同互动，管理诸如天气预测、日常安排、能源定价优化、安全监控以及备用电源激活等多种功能。它们不仅仅是响应式模块，还可以动态通信、共享记忆状态，并协同实现高层次系统目标，如实时优化舒适性、安全性和能源效率等。例如，天气预测 Agent 可能会发出热浪预警，能源管理 Agent 则会协调使用太阳能提前预冷，以避免高峰时段的高电价。同时，Agentic AI 系统还可能在无人时推迟高能耗任务或激活监控系统，实现跨领域的决策整合。

应用

另外，AI Agent 和 Agentic AI 在应用场景方面也存在不同。如下：

AIAgent：

客户支持自动化和内部企业搜索：利用检索增强的 LLM 和企业知识库，AI Agent 可以自动回答用户查询、处理工单、检索文档等，从而提高效率并降低成本。
电子邮件过滤和优先排序：AI Agent 可以分析邮件内容和元数据，自动分类、提取任务、建议回复等，从而帮助用户管理电子邮件，提高工作效率。
个性化内容推荐和基本数据报告：AI Agent 可以分析用户行为和兴趣，生成个性化推荐或数据报告，从而提高用户体验并支持数据驱动的决策。
自主调度助手：AI Agent 可以根据用户偏好和日历，自动安排会议、预订行程等，从而提高日程管理效率和灵活性。

Agentic AI：

多智能体研究助理：多个 AI Agent 协同工作，检索、总结、起草科学内容，从而加速科研进程并提高效率。
智能机器人协调：多个机器人协作完成任务，例如仓库自动化、农业无人机检测、机器人采摘等，从而提高效率和生产力。
协作医疗决策支持：多个 AI Agent 协同工作，进行诊断、监测、治疗规划等，从而提高医疗诊断的准确性和治疗的有效性。
多Agent游戏 AI 和自适应工作流自动化：多个 AI Agent 协同工作，进行游戏探索、流程自动化等，从而提高游戏体验和业务流程的效率。

图 | AI Agents 和 Agentic AI 在八个核心功能领域的分类应用。

挑战与局限

此外，AI Agent 和 Agentic AI 面临的挑战也不同。

AI Agent 在利用 LLM 和工具使用接口自动化结构化任务方面，存在可靠性差、泛化能力不足和长期自主性弱等问题。这些挑战既源于其对静态预训练模型的依赖，也在于其难以具备因果推理、规划和鲁棒适应等 Agent 特性，主要分为以下 5 点：

缺乏因果理解：AI Agent 难以区分相关性和因果关系，导致在面临新情况时表现不佳。
LLM 限制：LLM 存在一些固有的限制，例如幻觉、脆弱性、可解释性差、知识截止日期、偏见等，这些限制会影响 AI Agent 的性能和可靠性。
不完全的智能体属性：AI Agent 的自主性、主动性、响应性和社交能力不足，这限制了它们的应用范围和功能。
有限的长期规划和恢复能力：AI Agent 难以进行多步骤规划和处理任务失败，这限制了它们在复杂环境中的适应能力。
可靠性和安全性问题：AI Agent 在分布性变化下可能出现不可预测的行为，这会影响它们的可靠性和安全性。

尽管多 Agent 架构使得自动化的目标更加宏大，但它为 Agentic AI 系统带来了一系列放大和全新的挑战，这些挑战加剧了基于 LLM 的单个 Agent 所固有的局限性，具体如下：

因果性挑战加剧：Agent之间的相互作用会放大因果性缺陷，导致协调问题和错误传播。
通信和协调瓶颈：Agent 之间难以进行高效、精确的沟通和协调，这会影响系统的性能和效率。
涌现行为和可预测性：Agent 之间的复杂交互可能导致不可预测的行为和系统不稳定，这会影响系统的可靠性和安全性。
可扩展性和调试复杂性：随着 Agent 数量和功能的增加，系统变得越来越复杂，难以调试和维护。
可解释性和可验证性：难以解释 Agent 的行为和验证其决策的正确性，这会影响用户对系统的信任度。
安全性和对抗性风险：易受攻击，例如对抗性样本攻击和模型中毒，这会影响系统的可靠性和安全性。
伦理和治理挑战：难以确定责任、公平性和价值一致性，这会影响系统的社会接受度和伦理合法性。

解决方案与未来展望

基于以上 AI Agent 和 Agentic AI 暴露出的问题，研究团队提出了多项改进策略：

检索增强生成（RAG）：通过将用户查询与向量数据库（如 FAISS、Pinecone）语义匹配，AI Agent 可实时引用外部信息，减少幻觉生成。对于 Agentic AI 系统，统一的检索生成流水线可为各子 Agent 提供共享记忆，提升一致性与抗误导能力。

工具化增强推理（Function Calling）：Agent 可调用 API、执行脚本或查询数据库，实现动态感知与任务执行，如天气查询、日程安排、运行代码等。多 Agent 协作中，借助函数接口实现职责分工与有序衔接。

Agentic 循环（ReAct Loop）：将“推理→执行→观察”构成闭环，Agent 在每次调用工具或 API 后，先对结果进行验证，再进行下一步推理，从而在单次任务中反复校正、持续纠错。多 Agent 场景下，需要基于共享日志和统一的反馈机制，将各自的观察结果汇聚、对齐，确保系统整体的反思能力不分裂。

多层次记忆架构：包括情景记忆（记录交互过程和反馈）、语义记忆（保存结构化领域知识）与向量记忆（支持相似度检索）；在多 Agent 系统中，各 Agent 可维护本地记忆并访问共享全局记忆，实现跨任务的连续性、个性化和长期规划。

多角色协同：为应对复杂任务，系统引入策划者、摘要者、审校者等专精角色，由元 Agent 协调，提升可扩展性与容错能力。

反思与自我批评机制：Agent 完成初步输出后，利用二次推理流程对自身结果进行审视和验证。在 Agentic AI 中，可让“审核者”Agent 专门对其他 Agent 的成果进行交叉检查，实现协作式质量把关，促进系统在迭代中不断自我优化。

程序化提示工程：避免手工调参带来的不可复现和脆弱性，通过代码化的任务模板、上下文填充器及检索变量，动态生成结构化提示。各角色 Agent 统一使用此流水线，确保消息格式、依赖追踪和语义对齐的一致性，杜绝多 Agent 协作中的“提示漂移”现象。

因果建模与模拟规划：将因果推断嵌入 Agent 推理，使其能够区分关联与因果、进行干预模拟。例如在供应链场景中，Agent 可预测延迟对下游节点的因果影响。在多 Agent 协调时，通过 STRIPS 或 PDDL 等规划语言，明确定义行动的前置条件和效果，实现更安全、更可靠的协作。

监控、审计与可解释性：记录提示、工具调用、记忆更新和输出日志，为事后分析与故障排查提供依据。多 Agent 环境下，串联各 Agent 的审计痕迹和对话重放，帮助开发者迅速定位错误源头，并通过可视化管道提高系统透明度。

治理感知架构：通过访问控制、沙箱机制与身份管理，实现决策可控与行为可追溯。多 Agent 系统中，凭借责任归属和合规检查，构建可信的 AI 生态，降低在医疗、金融等敏感领域的应用风险。

最后，研究团队还提出了 AI Agent 和 Agentic AI 的未来发展路线图。

图｜AI Agent 和AgenticAI 的未来路线图

AI Agents 将在五个关键领域实现突破：主动推理、工具集成、因果推理、持续学习与可信操作。

首个重要转变是从被动响应向主动智能迈进。Agent 将基于模式、上下文或潜在目标主动发起任务，并能动态接入数据库、API 等系统以完成复杂任务。因果推理的发展也至关重要，使 Agent 能理解因果关系，从而更好地支持诊断、规划和预测。为保持适应性，Agent 需具备持续学习能力，借助反馈和情境记忆不断调整行为。这些能力将推动 Agent 从静态工具演变为具备自主性和可控性的认知系统。

Agentic AI 是在此基础上的自然延伸，强调多 Agent 协作、上下文持久化和任务编排。未来系统将支持多 Agent 并行协作，类似人类团队，通过协调层分配角色、管理依赖关系并解决冲突。持久记忆架构将保障长任务协调和状态感知。模拟规划也将成为核心能力，帮助 Agent 在执行前测试策略、预测结果并优化行为。同时，伦理治理框架将确保 Agent 网络的责任归属与价值对齐。各行业也将涌现出领域专用系统，利用上下文知识实现比通用 Agent 更强的能力。

研究团队还提到了清华大学黄高教授团队提出的新型学习范式 AZR（arXiv:2505.03335），该研究使 AI 不再依赖外部数据，而通过自主生成、验证与解决任务实现自我进化，借助如代码执行等可验证机制推动学习。这为在数据稀缺环境中实现真正自主、可适应的推理 Agent 提供了可能。

结合 AZR，多个专用 Agent 可在协调工作流中共同进化。例如，科学研究可由提出假设、模拟实验、验证结果、调整策略的 Agent 自动完成，完全通过自我博弈与可验证推理，无需持续人工介入。研究团队认为，AZR 为 AI Agent 和 Agentic AI 向下一代 AI 的转变奠定了基础。

来源：36kr

时间: 2025-5-29 16:31

作者: 不吹不黑

一文读懂！

通信人家园 (https://www.txrjy.com/)