通信人家园

标题: 这个关于DeepSeek的说法比较靠谱  [查看完整版帖子] [打印本页]

时间:  2025-2-1 16:30
作者: wjhqr     标题: 这个关于DeepSeek的说法比较靠谱

提示: 作者被禁止或删除 内容自动屏蔽
时间:  2025-2-1 16:47
作者: wjhqr

提示: 作者被禁止或删除 内容自动屏蔽
时间:  2025-2-1 18:17
作者: 狼人克星

wjhqr 发表于 2025-2-1 16:47
第4点“DeepSeek利用模型蒸馏技术,依赖现有模型(如 GPT-4o和o1)进行训练”,这个可能是DS如此成功的关键 ...

只要加一个“可能”
你想放什么谣言都无懈可击。
时间:  2025-2-1 18:38
作者: 客家人

狼人克星 发表于 2025-2-1 18:17
只要加一个“可能”
你想放什么谣言都无懈可击。

  合理分析罢了,不要啥都是谣言。
时间:  2025-2-1 19:19
作者: wjhqr

提示: 作者被禁止或删除 内容自动屏蔽
时间:  2025-2-1 19:25
作者: wjhqr

提示: 作者被禁止或删除 内容自动屏蔽
时间:  2025-2-1 19:37
作者: 狼人克星

客家人 发表于 2025-2-1 18:38
合理分析罢了,不要啥都是谣言。

客总可能今天上厕所没有带纸。
时间:  2025-2-1 20:48
作者: 客家人

狼人克星 发表于 2025-2-1 19:37
客总可能今天上厕所没有带纸。

  你是中专生的骄傲,和中专生一样的认知,啥都是谣言,为了反对而反对,这是小hong粉的特点
时间:  2025-2-1 20:50
作者: 狼人克星

客家人 发表于 2025-2-1 20:48
你是中专生的骄傲,和中专生一样的认知,啥都是谣言,为了反对而反对,这是小hong粉的特点

客总可能拿不到16亿的分红。
时间:  2025-2-1 21:16
作者: 10219459

既然蒸馏真好,那么他们自己不用吗?还是必须找些理由。
时间:  2025-2-1 21:57
作者: 伤心小镇

我不懂AI,但是美帝常干的玩不过就栽赃抹黑的套路,我懂。
时间:  2025-2-2 01:02
作者: 不吹不黑

厉害了!!
时间:  2025-2-2 20:25
作者: xhy133

了解
时间:  2025-2-3 17:51
作者: oooooooo

wjhqr 发表于 2025-2-1 19:25
当然光有模型蒸馏还远远不够,DeepSeek也有一些自己独到的东西,还是非常牛叉的,这个咱也不懂。
在现有模 ...

辉达,难怪
时间:  2025-2-3 20:38
作者: visioner

wjhqr 发表于 2025-2-1 19:19
梁文峰很鸡贼,蒸馏了其它大模型,获取了数据和推理逻辑。利用了opanAI们超强的算力资源为己所用,构建了自 ...

*,在DeepSeeker-v3出来之前,美帝的AI大模型公司自己就不会蒸馏出更好的模型?
时间:  2025-2-3 22:46
作者: wqfreebird

visioner 发表于 2025-2-3 20:38
*,在DeepSeeker-v3出来之前,美帝的AI大模型公司自己就不会蒸馏出更好的模型?

总有人给美国洗地,总认为自己的同胞不行。真是邪门了。
时间:  2025-2-4 17:09
作者: 清河人

大批用了昇腾




通信人家园 (https://www.txrjy.com/) Powered by C114