【转】中文「深度搜索」测评结果发布！华为盘古第一名？ [复制链接]

军衔等级：

电梯直达

1^# 大中小

发表于 2025-12-2 22:20:25 |只看该作者 |倒序浏览

随着大模型技术的迅猛发展，其在信息检索领域的应用已成为人工智能研究的重要方向。深度搜索作为一种能够深入互联网找到难以获取信息的能力，正日益成为评估大模型综合能力的关键维度。

为了更好地衡量和评估大模型在复杂繁多的信息中检索关键信息的能力，我们决定推出中文深度搜索测评基准：SuperCLUE-DeepSearch，基准方案可见：中文「深度搜索」测评基准方案发布！该基准的核心在于建立一套科学、全面的评估体系，以衡量大模型在复杂信息环境中的导航、搜索和整合能力。

本次测评共有24个国内外模型/产品参与，包括11个模型和13个智能体，我们将最后的测评结果榜单分为模型和智能体两个赛道，以下是详细的测评分析。

GMT+8, 2026-7-5 01:10 , Processed in 0.073297 second(s), 16 queries , Gzip On.

回顶部

		自动登录	找回密码
密码			注册