只需一步,快速开始
短信验证,便捷登录
军衔等级:
中校
其中既有清华大学的C-Eval、上海交通大学的CMMLU、伯克利的大模型竞技场(Chatbot Arena)等知名学府推出的榜单,也有民间高手自建的MMLU,甚至于做投资的红杉中国也搞出了自己的AI基准测试工具xbench。
0 举报本楼
发表回复 回帖后跳转到最后一页
版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图
GMT+8, 2025-6-6 14:06 , Processed in 0.130121 second(s), 18 queries , Gzip On.
Copyright © 1999-2023 C114 All Rights Reserved
Discuz Licensed