通信人家园

标题: 【下载】字节跳动Seed-Thinking-v1.5技术文档  [查看完整版帖子] [打印本页]

时间:  2025-4-14 13:14
作者: Oishiimono     标题: 【下载】字节跳动Seed-Thinking-v1.5技术文档

本帖最后由 Oishiimono 于 2025-4-14 13:16 编辑

字节跳动_Seed-Thinking-v1.5_Advancing Superb Reasoning Models with Reinforcement.pdf (1.75 MB, 下载次数: 8)
GitHub开源地址:链接

(来源:IT之家)字节跳动最新思考模型 Seed-Thinking-v1.5 技术细节今日公开,该模型将于 4 月 17 日通过火山引擎开放接口供用户体验。

该模型在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出,同时,模型采用 MoE 架构,总参数 200B,激活参数为 20B,具备显著的推理成本优势,单位推理成本相比 DeepSeek R1 降低 50%。


模型各方面具体表现:

数据体系:融合可验证与创意性数据

针对推理与生成任务的不同需求,团队优化了数据处理策略:

奖励模型:双轨体系校准训练方向

团队提出双轨奖励机制,兼顾“对错分明”与“见仁见智”任务:

训练方法:“监督精调 + 强化学习”双阶段优化

Seed-Thinking-v1.5 采用“打基础 + 磨能力”的全链路训练:

训练框架:支撑 20B MoE 的底层架构

为应对 20B MoE(总参数 200B)的复杂训练需求,团队优化了底层架构:





附件: 字节跳动_Seed-Thinking-v1.5_Advancing Superb Reasoning Models with Reinforcement.pdf (2025-4-14 13:11, 1.75 MB) / 下载次数 8
https://www.txrjy.com/forum.php?mod=attachment&aid=NjgyNzA3fDk5MzY1YWY4fDE3NTQyMjU1MTl8MHww
时间:  2025-4-14 14:12
作者: cnqq9999

感谢分享资料
时间:  2025-4-14 15:49
作者: 不吹不黑

资料不错哦




通信人家园 (https://www.txrjy.com/) Powered by C114