李飞飞最新长文：AI的下一个十年——构建真正具备空间智能的机器 [复制链接]

see122

军衔等级：

上校

电梯直达

1^# 大中小

发表于 2025-11-12 10:43:23 |只看该作者 |倒序浏览

机器之心报道

机器之心编辑部

就在昨晚，关于其投身的空间智能，斯坦福大学教授李飞飞发表了一篇长篇博客《From Words to Worlds: Spatial Intelligence is AI’s Next Frontier》。

在文中，李飞飞详细解读了「空间智能究竟是什么？它为什么重要？我们如何构建它？我们又如何使用它？」她同时阐述了真正的空间智能世界模型必须实现的核心框架：构建具有故事讲述者想象力的 AI、具备第一响应者流畅性的 AI 以及以科学精确性进行空间推理。

以下为全文翻译：

1950 年，当计算机还只是自动化的算术和简单逻辑时，艾伦图灵提出了一个至今仍余音不绝的问题：机器能思考吗？他拥有非凡的想象力，看到了一个超越时代的可能 —— 智能或许可以被「构建」，而非「诞生」。这一洞见开启了一个持久而伟大的科学征程 —— 人工智能（AI）。在我投身人工智能研究二十五年后的今天，图灵的愿景仍让我心怀敬意与灵感。但我们究竟走到了哪一步？答案并不简单。

如今，以大语言模型（LLM）为代表的前沿 AI 技术，已经开始改变我们获取和运用抽象知识的方式。然而，它们依然像是「黑暗中的文匠」：能言善辩却缺乏经验，知识丰富却脱离现实。空间智能将彻底改变我们创造和交互现实与虚拟世界的方式 —— 它将重塑叙事、创意、机器人学、科学发现等领域。这正是 AI 的下一个前沿。

自我踏入这一领域以来，对视觉与空间智能的追求一直是我心中的北极星。这也是我花费多年时间创建 ImageNet 的原因 —— 这是首个大规模视觉学习与评测数据集，与神经网络算法和现代计算（如图形处理器 GPU）一道，构成了现代人工智能诞生的三大基石。这也是为什么我的斯坦福实验室在过去十年中，持续探索将计算机视觉与机器人学习相结合。

而这一追求，也促使我与合伙人 Justin Johnson、Christoph Lassner、Ben Mildenhall 共同创立了 World Labs—— 在一年多前，我们立志首次将这一愿景彻底实现。在这篇文章中，我将阐述什么是空间智能、它为何重要，以及我们如何构建能够释放空间智能潜力的世界模型 —— 这种能力将深刻影响创造力、具身智能与人类的未来进步。

空间智能：

人类认知的脚手架

人工智能正处在前所未有的激动人心时刻。生成式 AI 模型 —— 例如大语言模型（LLM）—— 已经从研究实验室走入日常生活，成为数十亿人创造、工作与沟通的工具。它们展现出了曾被认为不可能的能力：能够轻松生成连贯的文本、海量的代码、逼真的图像，甚至短视频片段。如今，问题已不再是「人工智能是否会改变世界」，而是「它已经如何改变了世界」。

然而，仍有许多目标尚未触及。自主机器人的愿景依旧令人神往，却依然停留在推测阶段，离未来学家长期描绘的日常现实仍有距离。在疾病治疗、新材料发现、粒子物理等领域，人工智能加速科研的梦想也尚未真正实现。而一种能够真正理解并赋能人类创造者的 AI—— 无论是学习分子化学复杂概念的学生、构思空间的建筑师、构建世界的电影创作者，还是渴望沉浸式虚拟体验的任何人 —— 这一承诺仍未兑现。

要理解这些能力为何依然难以实现，我们需要回溯空间智能的演化历程，并审视它如何塑造了我们对世界的理解。

视觉一直是人类智能的基石，但它的力量源自更为根本的东西。早在动物学会筑巢、照料幼崽、用语言交流或建立文明之前，最简单的「感知」行为，便悄然点燃了一场通向智能的进化旅程。

这种看似孤立的能力 —— 从外部世界中提取信息，无论是一道微光，还是一种触感 —— 在感知与生存之间搭起了一座桥梁，并随着世代更迭不断加固、延展。神经元层层叠加，沿着这座桥梁生长，形成了能解释世界、协调生物体与环境互动的神经系统。正因如此，许多科学家推测，感知与行动构成了驱动智能演化的核心循环，也成为自然创造人类这一物种的根基 —— 一种集感知、学习、思考与行动于一体的终极体现。

空间智能在定义人类如何与物理世界互动中起着根本性的作用。每天，我们都依赖它完成最平常的行为：停车时通过想象车尾与路缘之间逐渐缩小的间隙来判断距离；接住被人扔来的钥匙；在人群密集的人行道上穿行而不相撞；或者在半睡半醒间不看杯子也能准确地把咖啡倒进去。在更极端的情境中，消防员在浓烟弥漫、结构不断坍塌的建筑中穿行，瞬间判断稳定与危险，依靠手势、身体语言以及一种无法用言语表达的职业直觉进行协作。

而婴儿在还未学会说话的数月甚至数年中，正是通过与环境的嬉戏互动来认识世界。所有这一切都在无意识间、自动地完成 —— 这种流畅性，是机器至今尚未具备的。

空间智能同样是人类想象力与创造力的基础。讲故事的人在脑海中构建独特而丰富的世界，并借助各种视觉媒介将其传达给他人 —— 从史前的洞穴壁画，到现代电影，再到沉浸式电子游戏。无论是孩子在沙滩上筑起的沙堡，还是他们在电脑上玩《我的世界》所创造的空间，这种基于空间的想象力构成了现实与虚拟世界中交互体验的核心。而在众多行业应用中，对物体、场景和动态交互环境的模拟，正支撑着从工业设计到数字孪生再到机器人训练的无数关键业务场景。

纵观历史，空间智能在推动文明发展的关键时刻屡次扮演核心角色。在古希腊，埃拉托色尼通过几何化阴影来揭示地球的尺度 —— 他在亚历山大测量出七度的日影角度，并在太阳直射、影子消失的赛恩进行对比，计算出了地球的周长。哈格里夫斯通过一个空间构想发明了「珍妮纺纱机」：将多个纺锤并列在同一架构中，使一个工人能够同时纺出多股纱线，生产效率因此提升八倍。沃森和克里克通过亲手搭建三维分子模型、不断调整金属板与铁丝的位置，最终发现了 DNA 的双螺旋结构。

当科学家与发明家需要操纵物体、想象结构、推理空间关系时，正是空间智能推动了人类文明的跃进 —— 而这些都无法仅凭文字所捕捉。

空间智能是支撑人类认知的脚手架。无论我们是在被动观察，还是主动创造，它都在发挥作用。它驱动我们的推理与规划，哪怕是在最抽象的思维领域；它也是我们与他人、与环境进行互动 —— 无论通过语言还是行动 —— 所必不可少的能力。虽然我们大多数人并不会像埃拉托色尼那样揭示新的宇宙真理，但我们几乎每天都以相似的方式思考 —— 通过感官理解复杂的世界，并凭借对物理与空间规律的直觉掌握，来形成认知与判断。

遗憾的是，当下的人工智能尚未具备这种思维方式。

过去几年，AI 的确取得了巨大进步。多模态大语言模型（MLLM）在文本之外引入了海量的多媒体数据，使 AI 具备了初步的空间感知能力。如今，AI 已经能够分析图像、回答相关问题，并生成高度逼真的图片和短视频。借助传感器与触觉技术的突破，最先进的机器人也开始能够在高度受限的环境中操纵物体与工具。

然而，坦率地说，AI 的空间能力仍与人类相距甚远，这一差距显而易见。最先进的多模态模型在估算距离、方向和大小等任务上，其表现往往仅略高于随机水平；在「心智旋转」（从不同角度重新生成物体）的测试中也极为有限。它们无法穿越迷宫，不能识别捷径，也无法预测最基本的物理规律。AI 生成的视频 —— 虽令人惊叹，但往往在数秒后便失去连贯性。

当前最先进的 AI 在阅读、写作、研究和数据模式识别方面表现出色，但在对物理世界的表征与交互上却存在根本性局限。人类对世界的理解是整体性的 —— 不仅关乎我们「看见了什么」，还包括事物在空间上的关系、它们的意义以及彼此的关联。通过想象、推理、创造与互动来理解世界，而非仅仅依赖语言描述，这正是空间智能的力量。没有它，AI 就与它试图理解的物理现实脱节，无法真正安全高效地驾驶汽车、引导家庭或医院中的机器人，也难以实现学习与娱乐中的沉浸式互动体验，更无法加速材料科学与医学中的突破性发现。

哲学家维特根斯坦曾说，「我的语言的界限意味着我的世界的界限」。我不是哲学家，但我深知，对人工智能而言，世界远不止语言本身。空间智能代表着超越语言的前沿 —— 它连接了想象、感知与行动，开启了机器真正赋能人类生活的可能，从医疗到创造力，从科学发现到日常助理。

AI 的下一个十年：

构建真正具备空间智能的机器

那么，我们该如何打造具备空间智能的 AI？通往那样的模型之路是什么样的？它不仅能像埃拉托色尼那样进行空间推理，像工业设计师那样精准构造，像讲故事的人那样富于想象，还能像应急救援人员那样自然地与环境互动。

要实现空间智能，我们需要的远不止 LLM 那样的体系，而是更具雄心的「世界模型」—— 一种新型生成式模型，能够在语义、物理、几何与动态等多重复杂世界（无论虚拟还是现实）中进行理解、推理、生成与交互。

这一领域仍处在萌芽阶段，当前的研究方法从抽象推理模型到视频生成系统皆有涉及。World Labs 正是在这一信念之上，于 2024 年初创立：即世界模型的基础方法尚在确立之中，而这正是未来十年人工智能的关键挑战所在。

在这一新兴领域中，最重要的是确立指导发展的基本原则。对于空间智能而言，我将「世界模型」定义为具备以下三种核心能力的系统：

一是生成性：世界模型能够生成在感知、几何与物理层面保持一致的世界。

要解锁空间理解与推理的能力，世界模型必须能够生成属于自己的模拟世界。它需要具备创造出无限多样的虚拟世界的能力，这些世界必须遵循语义或感知层面的指令，同时在几何、物理和动态层面保持一致性 —— 无论这些世界对应的是现实空间还是虚拟空间。研究界目前正积极探索这些世界的内部几何结构应当以隐式还是显式的方式表示。

除此之外，我认为，除了强大的潜在表征之外，一个通用的世界模型还必须能够生成明确、可观测的世界状态，以适配不同的应用场景。尤其重要的是，它对当前世界的理解，必须与过去保持连贯 —— 与导致这一现状的先前世界状态相一致。

二是多模态性：世界模型在设计上即是多模态的。

正如动物与人类一样，世界模型应能够处理多种形式的输入 —— 在生成式 AI 中通常被称为提示词。当输入信息不完整时，无论是图像、视频、深度图、文本指令、手势还是动作，世界模型都应能够预测或生成尽可能完整的世界状态。这要求模型具备如真实视觉般处理视觉输入的能力，同时又能同样熟练地理解语义指令。这样的能力使得智能体与人类能够通过多样化的输入方式与模型就世界进行交流，并获得多样化的输出反馈。

三是交互性：世界模型能够根据输入的动作生成下一个世界状态。

当动作和 / 或目标成为世界模型的输入提示时，其输出必须包括世界的下一个状态 —— 可以是隐式的，也可以是显式的。当输入仅包含一个动作，或者包含动作与目标状态时，世界模型应能生成与先前世界状态、预期目标（若有）、语义含义、物理规律及动态行为相一致的输出。随着空间智能世界模型在推理与生成能力上的不断增强，可以想见，在某些情况下，模型不仅能预测世界的下一状态，还能基于这一新状态，进一步预测实现目标所需的下一步行动。

这一挑战的规模，超出了人工智能以往所面对的一切。

语言只是人类认知中一种纯粹的生成现象，而「世界」则遵循着远为复杂的规律。在地球上，重力主宰着运动，原子结构决定了光如何产生色彩与亮度，无数物理定律约束着每一次交互。即便是最奇幻、最具创造力的世界，其构成的空间物体与行动主体，也都必须服从特定的物理法则与动态行为。要在语义、几何、动态与物理层面上实现一致的统一与协调，需要全新的技术与理论路径。

相较于语言这样一维、顺序性的信号，对「世界」的表征在维度与复杂度上要庞大得多。要让世界模型具备人类所拥有的那种普适能力，必须突破多个艰巨的技术壁垒。在 World Labs，我们的研究团队正致力于在这一目标上取得根本性的进展。

以下是我们当前的一些研究方向：

1、一种新的通用训练任务函数：

为世界模型定义一种像 LLM 中的「下一 token 预测」那样简洁优雅的通用任务函数，一直是该领域的核心目标之一。然而，由于世界模型在输入与输出空间上的复杂性，使得这种函数的构建本身极具挑战。尽管仍有大量未知有待探索，但这种目标函数及其对应的表征方式，必须能够反映几何与物理规律，体现世界模型作为联结想象与现实的基础性表征体系的本质特征。

2、大规模训练数据：

训练世界模型所需的数据远比文本更为复杂。好消息是，大规模数据源已经存在。互联网上海量的图像与视频，提供了丰富且可获取的训练材料，真正的挑战在于如何研发能够从二维图像或视频帧（即 RGB 信号）中提取更深层空间信息的算法。过去十年的研究表明，在语言模型中，数据量与模型规模之间存在明确的「scaling laws」；对于世界模型而言，关键在于构建能够在相似规模上充分利用现有视觉数据的架构。

此外，高质量的合成数据，以及诸如深度信息与触觉信息等额外模态，也将在训练过程中的关键阶段发挥重要作用。但要实现这一目标，我们仍需更先进的传感系统、更稳健的信号提取算法，以及更强大的神经模拟方法。

3、新型模型架构与表征学习：

世界模型的研究将不可避免地推动模型架构与学习算法的革新，尤其是在超越当前 MLLM 与视频扩散模型范式的方向上。现有方法通常将数据离散化为一维或二维序列，这使得一些简单的空间任务变得不必要地困难 —— 比如统计短视频中独特的椅子数量，或记住一个房间一小时前的样子。替代性架构可能带来突破，例如具备三维或四维感知能力的分词、上下文和记忆机制。

以 World Labs 为例，我们最近开发的实时生成帧模型 RTFM（Real-Time Frame-based Model）正体现了这一方向的转变。它将空间锚定的帧作为一种空间记忆形式，在保持生成世界连续性与一致性的同时，实现了高效的实时生成。

显然，在通过世界模型彻底释放空间智能之前，我们仍面临着艰巨的挑战。这项研究不仅仅是理论探索，它将成为新一代创造力与生产力工具的核心引擎。而来自 World Labs 的最新进展令人振奋。我们近日首次向少量用户展示了 Marble 的早期成果 —— 这是首个能够通过多模态输入进行提示，从而生成并维持一致性三维环境的世界模型。用户与创作者可以在其中探索、交互，并在创作流程中不断扩展这一虚拟世界。我们也正全力推进，让它尽快向公众开放。

Marble 只是我们迈向真正具备空间智能的世界模型的第一步。随着研究不断加速，更多科学家、工程师、用户与商业领袖开始意识到它所蕴含的巨大潜能。新一代的世界模型将使机器在空间智能方面达到全新的高度，这将开启当今 AI 系统仍普遍缺乏的关键能力。

利用世界模型，

为人类创造更美好的世界

人工智能的发展动力至关重要。作为推动现代人工智能时代到来的一名科学家，我的初心始终清晰：AI 应当增强人类能力，而非取而代之。多年来，我一直致力于让 AI 的研发、应用与治理与人类需求保持一致。如今，关于科技乌托邦或末日论的极端叙事层出不穷，但我依然坚持一种更务实的观点：AI 由人类创造、由人类使用、也应由人类治理。它必须始终尊重人的自主性与尊严。

AI 的真正魅力，在于扩展我们的能力，使我们变得更加富有创造力、更加紧密相连、更高效、更有成就感。空间智能正是这种愿景的体现 —— 一种能让创作者、照护者、科学家与梦想家实现曾经不可能之事的 AI。这一信念，是我将空间智能视为人工智能下一个伟大前沿的根本动力。

空间智能的应用涵盖不同的时间维度。面向创作者的工具正在崭露头角 ——World Labs 的 Marble 已经让创作者与讲述者能够直接掌握这些能力。机器人学则代表了中期的雄心目标，我们正不断完善感知与行动之间的闭环。而那些最具变革性的科学应用可能需要更长时间，但它们有望对人类的繁荣产生深远影响。

纵观这些不同阶段，有几个领域格外值得关注，因为它们最有潜力重塑人类能力。要实现这一愿景，需要集体的巨大努力，远超任何一个团队或公司的能力范围。这需要整个 AI 生态系统的共同参与：研究者、创新者、企业家、公司，乃至政策制定者，都必须携手朝着共同的愿景前进。而这一愿景，值得我们全力以赴。接下来，让我们看看这个未来将来什么。

创造力：赋能故事叙述与沉浸式体验

「创造力是智力在享受乐趣。」这是我最喜爱的名言之一，出自我的精神偶像阿尔伯特爱因斯坦。早在文字出现之前，人类就已经在讲述故事 —— 他们将故事绘在洞穴的石壁上，口耳相传，代代延续，并以共同的叙事建构出整个文化。故事是人类理解世界的方式，是跨越时空的纽带，是我们探索「何为人」的途径，更是我们在生命与爱中寻找意义的核心。

如今，空间智能有潜力彻底改变我们创造与体验故事的方式 —— 不仅尊重叙事本身的根本价值，更将其影响力从娱乐延展到教育，从设计延伸到建筑，让创造与体验的边界得到全新拓展。

World Labs 的 Marble 平台正把前所未有的空间创造力与编辑控制力交到电影制作人、游戏设计师、建筑师以及各类叙事创作者手中，使他们能够快速创建并迭代可自由探索的三维世界，而无需承担传统 3D 设计软件所带来的复杂成本。创作行为依然保持其独特的人性与活力，而 AI 工具只是放大并加速了创作者能够实现的潜能。这其中包括：

在新维度中展开叙事体验：电影制作人和游戏设计师正在利用 Marble 创造完整的世界，不再受制于预算或地理的限制，他们得以探索传统制作流程中难以企及的场景与视角。随着不同媒介与娱乐形式之间的界限逐渐模糊，我们正迈向一种全新的交互体验形态，艺术、模拟与游戏的融合体。在这些个性化的世界中，不仅是大型工作室，任何人都可以创造并居住在属于自己的故事里。随着从概念与分镜到完整体验的生成过程变得更加快捷高效，叙事将不再局限于单一媒介，创作者可以自由地在多种平台与载体之间，构建互相关联的世界与故事线。

通过设计讲述空间叙事：几乎所有的制造物与建筑空间，在被实体化之前，都必须先在虚拟三维世界中完成设计。这一过程迭代频繁，且在时间与成本上代价高昂。借助具备空间智能的模型，建筑师可以在动工之前快速可视化建筑结构，甚至漫步于尚未存在的空间中，从而以一种讲故事的方式，探索人类未来的生活、工作与聚会方式。工业设计师与时尚设计师则能瞬间将想象转化为形态，直观地探索物体与人体及空间之间的关系。

全新的沉浸式与交互式体验：体验本身，是人类创造意义最深层的方式之一。在漫长的人类历史中，我们共享的唯一三维世界是物理世界。直到近几十年，随着游戏与早期 VR 的出现，我们才开始窥见人类自造「平行世界」的可能。如今，空间智能结合 VR、XR 头显以及沉浸式显示设备等新形态，将这种体验提升到了前所未有的高度。我们正迈向一个时代 —— 走进一个完全实现的多维世界，将如同打开一本书般自然。空间智能让「造世界」的能力不再只是专业团队与大型工作室的特权，而是向个人创作者、教育者以及任何怀抱想象的人开放。

机器人：具身智能的实践

从昆虫到人类，动物都依赖空间智能来理解、导航并与周围世界互动。机器人也将如此。自这一领域诞生以来，具备空间感知能力的机器一直是其终极目标 —— 这也包括我与斯坦福实验室学生和合作伙伴多年来的研究工作。这正是我对 World Labs 正在构建的世界模型充满期待的原因之一，因为它们有望真正让这一愿景成为现实。

通过世界模型扩展机器人的学习能力：

机器人的学习进步，取决于能否找到一种可扩展的训练数据解决方案。鉴于机器人在理解、推理、规划与交互中所面对的庞大状态空间，许多研究者推测，只有结合互联网数据、合成仿真以及人类演示的真实捕获，才能真正培育出具备泛化能力的机器人。

然而，与语言模型不同，目前机器人研究的数据极其匮乏。世界模型将在此发挥决定性作用。随着其感知精度与计算效率的提升，世界模型的输出能够快速缩小模拟与现实之间的差距，从而帮助机器人在无数状态、交互与环境的仿真中进行训练。

人类的伙伴与协作者：

作为人类的协作者，无论是在实验台前协助科学家，还是陪伴独居长者，机器人都能在劳动力与生产力极度紧缺的领域中提供支持。但要做到这一点，它们必须具备空间智能 —— 既能感知、推理、规划、行动，又能（这点最为重要）保持对人类目标与行为的情感共鸣与理解。

例如，在实验室中，机器人可以代替科学家操作仪器，让人类专注于更需要灵巧与推理的任务；在家庭中，助理机器人可以帮助老人烹饪，而不削减他们的自主性与生活乐趣。真正具备空间智能的世界模型 —— 能够预测下一状态，甚至推测与之相符的行动 —— 是实现这一目标的关键。

拓展具身智能的形态：

人形机器人在我们构建的世界中确有其角色，但创新的全部潜力将来自更为多样的设计形式：如可输送药物的纳米机器人、能穿越狭窄空间的软体机器人、以及适用于深海或外太空的探索型机器。无论形态如何，未来的空间智能模型都必须同时整合机器人所处的环境与其自身的感知与运动方式。

然而，这类机器人的发展面临的核心难题，是缺乏适用于多种具身形态的训练数据。世界模型将在这一过程中发挥关键作用 —— 它们将为仿真数据的生成、训练环境的构建以及评测任务的制定提供基础支撑。

更长远的视野：科学、医疗与教育

除了创意与机器人领域，空间智能的深远影响还将扩展至那些 AI 能够以拯救生命、加速发现等方式增强人类能力的领域。以下我将重点谈及三个具有深刻变革潜力的方向，但显而易见，空间智能的应用远不止于此，它将在更多行业中展现出广阔的前景。

在科学研究中，具备空间智能的系统能够模拟实验、并行检验假设、探索人类难以到达的环境 —— 从深海到遥远的行星。这项技术将重塑气候科学、材料研究等领域的计算建模方式。通过将多维度的仿真与真实世界的数据采集相结合，这类工具可以降低计算壁垒，拓展每一个实验室的观察与理解边界。

在医疗领域，空间智能将从实验室到病房，全面改变医学实践。在斯坦福，我与学生及合作伙伴多年来与医院、养老机构以及家庭患者紧密合作，这段经历让我更加坚信空间智能在医疗中的变革潜力。AI 可以通过多维建模加速药物发现；通过模式识别辅助放射科医生提升影像诊断的准确性；并通过环境感知式监护系统支持患者与护理者，而不削弱康复所需的人际联系。更不用说，具备空间智能的机器人也能在不同场景中，为医护人员与患者提供强大的帮助。

在教育领域，空间智能能够让抽象或复杂的概念变得可感知、可体验，从而实现沉浸式学习。它还能创造出与人类大脑与身体学习机制高度契合的迭代式学习体验。在 AI 时代，更快、更高效的学习与再培训，对学生与成年人都至关重要。学生可以以多维视角探索细胞运作机制，或亲身「走入」历史事件；教师则能借助交互式环境实现个性化教学；而外科医生、工程师等专业人士则可在逼真的仿真环境中安全练习复杂技能。

无论在哪个领域，空间智能所带来的可能性几乎没有边界，但目标始终如一：让 AI 增强人类的专业能力，加速人类的发现，放大人类的关怀 —— 而不是取代构成人之为人的核心品质：判断力、创造力与共情力。

结语

在过去的十年里，人工智能已成为全球现象，并成为技术、经济乃至地缘政治的转折点。然而，作为一名研究者、教育者以及如今的创业者，真正激励我的，仍然是图灵在 75 年前提出的那个问题背后的精神。我依然与他一样，怀抱着对智能的惊奇与敬畏。正是这种好奇与挑战的魅力，让我每天都为空间智能的探索而充满动力。

在人类历史上，我们首次有能力构建出与物理世界深度契合的机器，让它们成为我们在应对重大挑战时值得信赖的伙伴。无论是加速我们在实验室中对疾病的理解，革新我们讲述故事的方式，还是在疾病、伤痛或衰老带来的脆弱时刻给予支持，我们正站在一项能够提升人类最珍视生活要素的技术门槛上。这是一个让生命更加深刻、更加丰盈、更加有力量的愿景。

距自然在远古动物身上首次点燃空间智能的火花，已过去近五亿年。而我们有幸身处这样一个时代，或许很快，我们将让机器也拥有同样的能力；更幸运的是，我们能够将这种能力用于造福全人类。如果没有空间智能，我们对「真正智能机器」的梦想就永远无法完整。

原文链接：https://drfeifei.substack.com/p/from-words-to-worlds-spatial-intelligence

来源：网易

本主题由 System 于 2025-12-12 11:00 撤销图章

1 举报本楼

本帖有 7 个回帖，您需要登录后才能浏览登录 | 注册

返回列表

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图

GMT+8, 2025-12-27 23:05 , Processed in 0.285683 second(s), 17 queries , Gzip On.

Discuz Licensed

回顶部

		自动登录	找回密码
密码			注册