通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  中将

注册:2011-10-18381
跳转到指定楼层
1#
发表于 2023-7-6 13:41:25 |只看该作者 |倒序浏览

OpenAI一次性拿出20%总算力,投入全新研究方向——


超级智能对齐(Superalignment)。


a1ec08fa513d26971249654375baddf74216d8e7.jpeg@f_auto?token=7b68d4893bf5da505199b77620b4322d

先说说OpenAI的20%总算力什么概念?


光是微软此前专门给他们打造的一台超级计算机,就有285000块CPU和上万块英伟达A100 GPU。


外界没人知道OpenAI现在拥有多少H100 GPU,只知道他们总融资113亿美元,还要算上微软额外提供的Azure云算力。


这番大手笔,仿佛直接在科技圈扔下一个炸弹。


023b5bb5c9ea15ce10ce760c964155ff3a87b264.jpeg@f_auto?token=e6b6343b3f651645eef91bcc5122f657

再看这份公告中的微妙用词区别:


不是通用人工智能(AGI),甚至干脆去掉了人工二字。


直接越级瞄准如何控制超级智能,其定义为比人类聪明得多的AI系统(much smarter than us)。


2cf5e0fe9925bc311702f519419ee2bdca1370a5.jpeg@f_auto?token=8bec8d7f044a9422b538f42228c9123a

正文则明晃晃地写着:虽然看起来还很遥远,但我们相信超级智能将在这个十年段到来。


472309f7905298222938599ac88b14c70a46d429.jpeg@f_auto?token=1f579597482a0d4638bb8745a7f97c36

现在是2023年下半年,总共留给人类的时间还有6年半。


OpenAI给自己定的时限更短,只有4年。


控制“奥创”需要“贾维斯”


有网友将OpenAI公布的研究方法形容为“贾维斯vs奥创”。


50da81cb39dbb6fd234709922b65c414972b3737.jpeg@f_auto?token=4d961604a9fe2605aba8d749435e1201

OpenAI明白靠人类自己已无法完成,提出新概念自动对齐研究员(automated alignment researcher)


也就是先训练一个大致达到人类水平的AI研究员,再投入大量算力快速迭代。


翻译一下:先努力达到技术奇点,然后直接开启大爆炸。


d1a20cf431adcbef4d39e1ccb3ee41d1a2cc9fbc.jpeg@f_auto?token=aa66b38f68a61ca97c58330132af9280

整个计划的基石,就是先打造第一个自动对齐研究员。


为此OpenAI提出一个临时解决方案,分为三项:


开发一个可扩展的训练方法为了在人类难以评估的任务上提供训练信号,需要利用AI来协助评估其他AI系统,称为“可扩展的监督”。


验证第一步产生的模型为了验证系统的一致性,自动搜索有问题的行为和有问题的内部结构。


对整个管道流程做压力测试通过故意训练不对齐的模型来测试整个管道,并确认技术可以检测到最糟糕的错误类型,也就是对抗性测试。


为什么说是临时解决方案?


OpenAI预计随着对问题进一步了解,研究重点将发生实质性变化,很可能增加全新的研究领域。


再翻译一下:只能走一步看一步。


d6ca7bcb0a46f21f036d9206e965046c0d33aedc.jpeg@f_auto?token=d7365ef6dc7fbe50b320575a4c4cb62b

首席科学家带队,成立全新部门


研究顶级的问题需要顶级的团队。


OpenAI联创和首席科学家Ilya Sutskever将与此前的对齐团队负责人Jan Leike共同领导新部门。


而成员不光包括OpenAI自己的员工,也包括来自其它公司的研究人员。


Ilya Sutskever是2012年开启深度学习时代的AlexNet作者之一,也是AlphaGo作者之一,此前已将AI对齐作为他的核心研究重点,总引用数超过40万。


dbb44aed2e738bd42d0e63bd81cae8da267ff9d9.jpeg@f_auto?token=87b9e0f826e7f5506f16b5fd677a7acb

Jan Leike则是ChatGPT的前身InstructGPT论文作者之一,并且早在2017年就参与了OpenAI与DeepMind合作的人类反馈强化学习方法。


a8ec8a13632762d09925a16abfad67f6503dc69d.jpeg@f_auto?token=1c79354132065fac91d1af542c090874

Jan Leike认为,OpenAI此次投资很可能比全人类此前对AI对齐研究的所有投资加起来还多。


eac4b74543a982264da8f009aac3d60d4a90eb05.jpeg@f_auto?token=8af3a1bba4aa9ba01f269c3262738720

算上这二位,目前新团队已有10位成员。


6a600c338744ebf8a9565bc3c6b8b8266159a7f0.jpeg@f_auto?token=bbfcb7bb779fdbb4859d2fbb24fd1b90

新一轮招聘也随之开启,分为研究经理(年薪42万-50万美元),研究科学家与研究工程师(年薪24.5万-45万美元),两种级别三个岗位。


42a98226cffc1e177b193bd155d1990f728de97e.jpeg@f_auto?token=c88e6a85eec23df7313b3ea808a9c563

谁来监管监管者?


对于OpenAI的大动作,学术界有不同观点。


认同的学者表示:自然智能通过竞争的进化奖励产生,AI通过对齐人类利益的进化奖励产生,并期待未来的效果。


9d82d158ccbf6c8172e73313a37fde3931fa40c2.jpeg@f_auto?token=3beb34571ce323b0799716e8886eeba0

但也有人表示OpenAI从根本上就错误地理解了“对齐”这个概念。


他认为对齐不能是强制控制,而应该是使双方利益一致,类似于“堵不如疏”。


4bed2e738bd4b31c121d480aa29748739e2ff828.jpeg@f_auto?token=b49fbe959d7bafd901ff1a586db4a07b

有网友吐槽“真不敢相信,AGI很可能在鸽了很久的《上古卷轴6》游戏之前到来。”


评论区有人指出,到时候你想玩什么游戏让AI去做就好了。


f2deb48f8c5494ee1cc7208b32b48ff298257e0c.jpeg@f_auto?token=99ef5faa88299c91a5945e35330abb8b

也有网友灵魂发问,谁又来监管监管者呢?


9358d109b3de9c825a8b454048c0ef061bd843e4.jpeg@f_auto?token=51eaf05056e072272174f35bd14bb952


举报本楼

本帖有 2 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2025-8-20 12:44 , Processed in 0.517550 second(s), 21 queries , Gzip On.

Copyright © 1999-2025 C114 All Rights Reserved

Discuz Licensed

回顶部