通信人家园

标题: 【转】中文「深度搜索」测评结果发布!华为盘古第一名?  [查看完整版帖子] [打印本页]

时间:  2025-12-2 22:20
作者: coolstar00     标题: 【转】中文「深度搜索」测评结果发布!华为盘古第一名?

https://mp.weixin.qq.com/s/BMp5FYEbHa6bNp9VY6MJ0w

随着大模型技术的迅猛发展,其在信息检索领域的应用已成为人工智能研究的重要方向。深度搜索作为一种能够深入互联网找到难以获取信息的能力,正日益成为评估大模型综合能力的关键维度。
为了更好地衡量和评估大模型在复杂繁多的信息中检索关键信息的能力,我们决定推出中文深度搜索测评基准:SuperCLUE-DeepSearch,基准方案可见:中文「深度搜索」测评基准方案发布!该基准的核心在于建立一套科学、全面的评估体系,以衡量大模型在复杂信息环境中的导航、搜索和整合能力。
本次测评共有24个国内外模型/产品参与,包括11个模型和13个智能体,我们将最后的测评结果榜单分为模型智能体两个赛道,以下是详细的测评分析。






通信人家园 (https://www.txrjy.com/) Powered by C114