Deep Research的团队成员Josh Tobin表示,一些公司构建Agent时,会选择由人来搭建整个工作流,而工作流中的重要节点,会由大语言模型掌控,由其来决定下一步的行动。但这种方式构建出来的Agent会比较死板,难以灵活应付可能出现的所有场景。应该是,利用先进的推理模型,赋予它人类工作生活中使用的工具,直接针对期望Agent达成的结果进行优化。
所以Manus会强调「Less structure, more intelligence」,减少对AI的结构化限制,选择了依赖大模型能力来组建工作流。在大模型的指挥下,Agent会在自己的虚拟电脑上使用浏览器、编程工具等完成任务。这样的好处是随着大模型能力的增强,对任务的理解和拆分就会越准确。