见证历史!今天,首个由H100太空GPU训出LLM诞生了,它基于Karpathy nano-GPT训练。不仅如此,谷歌Gemma也在太空成功运行,向世界发出首句问候:地球人,你好。
「地球人,你好」!
这是谷歌开源Gemma模型,在外太空发送的第一条信息。
今天,英伟达太空GPU炼出了首个AI模型,彻底引爆了全网。
基于H100加持的Starcloud-1卫星,初创公司在Karpathy的nanoGPT上,用莎士比亚语料完成了训练。
最关键的是,它能以莎士比亚的口吻和人聊天——
our way
To the earthless and his foe to make him wish you.
LADY GREY:
They can it like you from me speak...
Karpathy本人激动表示,nanoGPT首个在太空进行训练和推理的模型,新征程,就此启航。
「nanoGPT一小步,AI一大步」。
还有,马斯克、前谷歌CEO等科技圈一众AI大佬们,纷纷点赞这一历史性成就。
此时此刻,科幻正照进现实。
首个太空LLM诞生,H100炼出的
11月初,一颗不起眼的卫星静静升空,却在人类科技史上留下浓墨重彩的一笔。
这颗由华盛顿州初创公司Starcloud发射的Starcloud-1卫星,搭载了一块H100。
其算力,要比以往任何进入太空的GPU强100倍!
令所有人没想到的是,在短短一个月时间内,它便在太空中,成功运行并训练出LLM。
在太空上,Starcloud-1卫星一共做了两件事。
首先,它能成功调用谷歌Gemma,并发出了亲切的问候——
地球人,你们好!或者,按照我更喜欢的方式来说——一颗蓝绿交织的美丽星球。
让我们看看,从这个高度俯瞰你们的世界,会展现出怎样的奇妙景象。
我是Gemma,我来观察、分析,偶尔也会给出一点略微诡异但相当有洞察力的评论。开始吧!
当它张口第一句「地球人,你们好」,仿佛像一个真正的地外智慧生命。
不仅如此,从Gemma反馈的复杂度来看,和我们在地球上提问的没什么差别。
这标志着,人类历史首次在太空,用上高性能的英伟达GPU来跑LLM。
第二件事,基于AI大神Karpathy的nanoGPT开源项目,用莎士比亚全集训练模型,并在太空中完成推理。
如上所示,这个LLM可以用文艺复兴时期的语言风格去回答问题。
GitHub项目地址:https://github.com/karpathy/nanoGPT
更绝的是,Starcloud-1还能做出实时情报分析,比如瞬间识别野火热信号,并立即通知应急人员。
诸如高度、姿态、位置、速度等,传感器信息的实时数据,全部接入了模型。
因此它可以做到,实时读取自身传感器数据,给出有趣的回答——
Q:你现在在哪?
A:我正飞越非洲上空,再过20分钟就到中东了。
Q:当一颗卫星是什么感觉?
A:感觉有点怪怪的...
地球装不下GPU
成立于2024年,Starcloud就是想证明:太空也可以成为数据中心的理想所在地。
为什么要把数据中心搬到太空?
答案只有一个:地球快扛不住了。
尤其是,当地球上的数据中心正给电网带来压力、每年消耗数十亿加仑水资源,并排放大量温室气体时。
国际能源署预测,到2030年,全球数据中心的用电量将超过如今的两倍。
靠太阳能无限供电,Starcloud的太空超算,能把成本砍到地面数据中心的1/10。
Starcloud CEO Philip Johnston坚定地认为,「你能在地面数据中心做的任何事,我相信未来都能在太空做到」。
最终,Starcloud要打造一个5GW轨道数据中心,配备宽高约4公里的太阳能板和冷却面板。
白皮书指出,太空算力集群,要比美国最大的发电厂还强,但占地和成本远低于地面同等太阳能农场。
Starcloud卫星的寿命约为五年,刚好与英伟达芯片使用周期一致。
目前,Starcloud已公布下一阶段路线图——
2026年10月,下一次发射将一次性搭载多枚H100,并整合Blackwell平台,提升AI性能。
还将集成云基础设施公司Crusoe的模块,让客户能够直接从太空部署与运行AI工作负载。
太空算力竞赛,正在失控
在太空这条赛道上,除了Starcloud这样的玩家,谷歌、SpaceX、蓝色起源群雄并起。
同在上个月初,谷歌官宣了Project Suncatcher,要把自研的GPU太阳卫星送上天。
它通过高吞吐量的自由空间光通信技术连接,在地球上空形成一个分布式计算集群。
一次采访中,CEO劈柴将其称之为「登月计划」。
他表示,谷歌的目标是利用近日点不间断的太阳能,计划在2027年利用卫星上的小型服务器机柜进行早期测试,并有望在十年内实现主流应用。
今天,WSJ一篇独家报道,揭秘了马斯克和贝索斯竞相,将其数据中心送上太空。
SpaceX将利用下一代星链(Starlink)卫星构建轨道数据中心,并在未来5年,成为成本最优的AI算力解决方案。
马斯克表示,Starlink V3卫星有望通过扩展,成为轨道算力基础设施的骨干网络。
「星舰」有望每年向轨道运送,相当于300吉瓦功率太阳能AI卫星,甚至可能达到500吉瓦。
每年这个量级,正是这个计划厉害所在。
他进一步指出,美国平均电力消耗约500吉瓦,以每年 300吉瓦速度计算,仅太空AI推理,每两年即可超越全美经济耗电量。
另外,贝索斯蓝色起源多年研发的「新格伦」(New Glenn)火箭取得重大进展。
预计,未来他们将会把大量卫星送入轨道。
就连OpenAI奥特曼也眼馋太空算力。
此前爆料称,奥特曼试图收购或合作火箭公司,也希望把AI算力部署到太空。
如此多的卫星上空,风险一定是有的。
摩根士丹利分析师指出,太空数据中心可能遭遇强辐射、难以在轨维修、太空碎片风险,以及涉及数据治理与太空交通的监管问题。
但正如历史上每一次基础设施迁移,先发者吃肉后发者喝汤,风险永远也挡不住野心。
团队介绍
Philip Johnston,联合创始人兼CEO
Philip Johnston是一位连续创业者,此前曾在麦肯锡任职,负责国家航天机构的卫星项目。
他拥有哈佛大学国家安全与技术方向的公共管理硕士学位(MPA)、沃顿商学院的MBA学位、哥伦比亚大学的应用数学与理论物理硕士学位,同时也是特许金融分析师(CFA)持证人。
Ezra Feilden,联合创始人兼CTO
Philip Johnston拥有十年的卫星设计经验,专攻可展开太阳能阵列和大型可展开结构。
他在空客防务与航天公司(SSTL)和牛津空间系统公司任职,参与了包括NASA「月球勘探者」在内的多项任务,拥有伦敦帝国理工学院材料工程博士学位。
Adi Oltean,联合创始人兼总工程师
Adi Oltean此前是SpaceX的首席软件工程师,作为主管工程师负责「追踪波束」项目,该技术使得Starlink(星链)能够服务于包括Starship(星舰)在内的其他航天器。
在此之前,他在微软担任了20年的首席软件工程师,致力于大型生产级GPU集群的研发,并发明了超过25项独特专利。
他拥有布加勒斯特大学计算机科学学位和布加勒斯特理工大学化学学位。
参考资料:
https://x.com/karpathy/status/1998806260783919434?s=20
https://www.cnbc.com/2025/12/10/nvidia-backed-starcloud-trains-first-ai-model-in-space-orbital-data-centers.html
来源:36kr
|