奋斗士 发表于 2026-6-10 15:32
基座大模型,是预训练完成的(Pre Training)。。。
后训练(Optimization Training)主要是优化对齐人类 ...
奋斗士 发表于 2026-6-11 09:40
这个论坛里,还有无数朋友圈小作文,在DeepSeek发布前,都在发小作文说:放弃了英伟达,完全采用华为卡训 ...

附件: DeepSeek V4 2.jpg (2026-6-11 10:33, 101.77 KB) / 下载次数 0
附件: DeepSeek V4 3.jpg (2026-6-11 10:33, 178.73 KB) / 下载次数 0
附件: DeepSeek V4 1 通信人家园.jpg (2026-6-11 10:33, 409.63 KB) / 下载次数 0
附件: DeepSeek V4 4.jpg (2026-6-11 10:33, 81.34 KB) / 下载次数 0
附件: DeepSeek V4 5.jpg (2026-6-11 10:33, 315.08 KB) / 下载次数 0
附件: DeepSeek V4 6.jpg (2026-6-11 10:33, 314.59 KB) / 下载次数 0
| 通信人家园 (https://www.txrjy.com/) | Powered by C114 |