训练耗费的时长(GPU小时)×H800每GPU小时的租赁价格(美元)=DeepSeek-V3训练成本(美元)
2,788,000×2=5,576,000(美元)
天数×24小时×H100 GPU个数=预训练阶段耗费的GPU小时 54×24×16,000=20,736,000
天数×24小时×H100 GPU个数=训练阶耗费的GPU小时 90×24×8,000=17,280,000(小时) 训练耗费的GPU小时×H100每GPU小时的租赁价格=训练成本 17,280,000×2.8=48,384,000(美元)
预训练阶段耗费的GPU小时÷H800 GPU个数÷24小时=天数 2,664,000÷2048÷24≈54(天)
通信人家园 (https://www.txrjy.com/) | Powered by C114 |