球在桌子边滚动→它可能会掉下去 开车的时候,看到红灯→如果不刹车可能出事故 两个人对话,其中一个人说「我饿了」→下一步很可能是找吃的
只要一个智能体真的能完成多步、复杂的目标任务,它的策略里必然隐含了世界模型。