当AI模型拥有千万级Token的超长记忆力时,如何检验它们的真正实力?OpenAI给出了新答案:MRCR基准测试。这不再是简单的「大海捞针」,而是要求模型在海量文本中,区分并找到多个一模一样的「针」中的特定一个,难度堪称「AI 界的奥运会」。MRCR不仅有助于揭示当前AI的能力边界,也将促使下一代更强大、更可靠模型的诞生。
雕塑在大理石块中已经完成,甚至在我开始工作之前就已经存在。
它就在那里,我只需要凿去多余的材料。
——米开朗基罗
通信人家园 (https://www.txrjy.com/) | Powered by C114 |