文学城论坛
+A-

是否deepseek会伪造成本, 损失大量托管资金以破坏美国股市?它是开源的,所以很快就会有人尝试相同的方案

UCLAhi 2025-01-28 11:25:40 ( reads)

DeepSeek 最近宣布为其 DeepSeek-V3 模型提供 560 万美元的培训费用,

560 万美元的数字:它代表什么?

DeepSeek-V3 的最终训练运行成本

基于两个月内 2,048 个 H800 GPU

处理了 14.8 万亿个代币

假设 GPU 租赁价格为每小时 2 美元

这个成本缺少什么?

研发费用:之前的研究、失败的实验和前驱模型

数据成本:训练数据集的获取和准备

人员:研究和工程团队的工资

基础设施:电力、冷却和维护

 

硬件:GPU 的实际成本(可能数亿)

一些分析师估计 DeepSeek-V3 的总研发预算可能约为 1 亿美元,更保守的估计为 DeepSeek 的运营每年在 5 亿美元到 10 亿美元之间。

跟帖(2)

Pilsung

2025-01-28 11:29:32

没做过生意的纯技术宅男是不用考虑cost,只需要研究算法. LOL

香草仙子

2025-01-29 16:11:15

同感梁有可能是为了做空美国科技股有意报低成本或不澄清媒体误读。他原本是做对冲基金的。有sense有能力