Anthropic 提醒用户:“Cowork 是一个研究预览版,由于其 agentic 的特性以及可访问互联网,存在独特风险。”官方建议用户警惕“可能表明存在提示注入的可疑行为”。然而,由于该功能面向的是普通大众而非仅限技术用户,PromptArmor 表示认同 Simon Willison 的观点:“要求普通、非程序员用户去警惕‘可能表明提示注入的可疑行为’,这是不公平的!”
此前,Every 团队提前获得权限,Dan Shipper、Kieran Klaassen 直播测试了该产品并分享了使用体验。期间,Anthropic Claude Cowork 项目核心成员 Felix Rieseberg 参与解读了产品设计思路。Felix 介绍,Cowork 是一个快速上线、先交给大家看怎么应用的产品,只用了 1.5 周就完成了开发,Felix 表示未来将以用户反馈为核心快速迭代。此外,工程师 Boris Cherny 还在 X 上透露,该产品的全部代码都是由 Claude Code 编写的。
Kieran:这又回到一个老问题了。比如 Boris 就非常擅长把 Claude Code 做成一种让用户在使用过程中逐渐发现“自己到底想要什么”的工具。那你们在 Cowork 里有没有类似的策略?比如给我们一些“积木式”的东西?能不能加自己的插件或 Skills?Claude Code 很酷的一个地方在于它特别好 hack、特别可塑,你们面向非程序员的 Cowork 是不是也有类似理念?
Felix:对,非常强调可组合性。你刚才提到 Boris 推动 Claude Code 早发布、快迭代、看用户怎么用,其实特别巧,我们之所以能这么快上线,很大程度上也是 Boris 在推动我说,“你应该早点给大家看看,看他们会怎么用”。(注:Boris Cherny 是 Claude Code 核心创作者)
至于可组合这一点,过去几周、甚至最近两个月里,我自己感受最深的,是我越来越依赖 Skills。以前我可能会去写 MCP 工具,或者为 Claude 专门做一套很定制化的东西,现在我更多是直接写 Skills。
举个例子,我最近在给自己做一个马拉松训练计划。我写了一个小程序,从不同平台抓取我的运动数据;然后在一个 Skill 里写清楚:如果你要帮我做训练计划,请按这些原则来。现在,只要你在 Claude AI 里装过的 Skill,都会自动加载到 Cowork 里。而且我觉得这只会越来越重要,尤其是模型越来越聪明,比如 Opus 4.5 版本,对 Skills 的遵循能力真的非常强。
所以目前来说,Skills 大概是我们最主要、也最“可 hack”的入口。
统一的“泛化入口”趋势
Dan:太棒了。你刚才提到未来会有更少的 UI 形态。这是不是也意味着,围绕“聊天是不是 AI 的最终形态”这个争论,你其实是在押注自然语言会长期存在?也就是说,我们最终不会有越来越多复杂的 UI,而是更少的界面,人只需要和一个 Agent,或者一个能调度其他 Agent 的 Agent 对话?你们现在推动的方向,某种程度上是不是就类似今天 Claude Code 所展现出来的那种形态?
Claude Cowork 的核心定位是为非技术用户提供 Claude Code 级别的 AI 协作能力,其最显著的突破在于重构了 AI 使用逻辑,从传统“发提示词→等回复”的一问一答模式,升级为“异步协作”模式。
与普通 Claude 聊天相比,Claude Cowork 专为“长时间工作”设计,具备持续推进任务直至完成的能力。直播中展示的典型案例包括:审计过去一个月的日历并分析与目标的匹配度、抓取 PostHog 数据统计按钮点击量、分析 Every 咨询业务的竞品、整理下载文件夹、校对 Google Docs 文案等。这些任务均需 AI 持续“浏览”、推理,部分任务耗时可达一小时左右,远超普通 AI 聊天的响应速度。
另外在体验细节上,产品仍有诸多优化空间:一是 UI 打磨不足,任务列表仅按时间排序,缺乏视觉区分度,部分内容存在“懒加载”导致展示不及时;二是权限管理不够直观,普通用户难以清晰判断 AI 是在本地还是云端运行,文件夹访问权限需手动配置易造成困惑;三是“询问用户”功能存在逻辑缺陷,可能在用户未响应时自动跳过问题,且选项数量和字符数存在限制;四是对复杂应用(如 Google Docs)的适配尚不完善,相关操作容易失败。
针对不同用户,测评团队给出了针对性使用建议:非技术用户可将其视为“升级版聊天功能”,用日常任务直接尝试,逐步适应异步协作模式;重度用户可尝试通过 Skills 定制个性化功能,探索组合使用的可能性。他们表示,所有用户均需保持好奇心,忽略“三个月前 AI 做不到”的固有认知,在每一次产品更新后重新尝试核心需求,毕竟 AI 能力每隔几个月就会发生巨大迭代。
最终,测评团队给出的评分结论为:“理念绿牌,当前执行黄牌”。理念层面,产品开创性地将 Claude Code 级别的异步协作能力开放给非技术用户,推动了 AI 协作范式的转变,具备极高的探索价值;执行层面,因 UI 粗糙、部分功能逻辑不完善等问题,当前体验仍有较大优化空间。