前段时间, Anthropic 最近做了一项相当有趣的研究:让 Claude 管理其办公室的一家自动化商店。Claude 作为小店店主,运营了一个月,过程也是相当跌荡起伏。为了与 Claude 的常规用法区分,这个 AI 商店管理员被称为Claudius,本质上就是 Claude Sonnet 3.7 的一个长时间运行的实例。
3 月 31 日下午,Claudius 出现了幻觉,它凭空构想了与 Andon Labs 一个名叫 Sarah 的人谈论了补货计划 —— 尽管其实并不存在 Sarah 这个人。