是否deepseek会伪造成本, 损失大量托管资金以破坏美国股市?它是开源的,所以很快就会有人尝试相同的方案
UCLAhi
2025-01-28 11:25:40
( reads)
DeepSeek 最近宣布为其 DeepSeek-V3 模型提供 560 万美元的培训费用,
560 万美元的数字:它代表什么?
DeepSeek-V3 的最终训练运行成本
基于两个月内 2,048 个 H800 GPU
处理了 14.8 万亿个代币
假设 GPU 租赁价格为每小时 2 美元
这个成本缺少什么?
研发费用:之前的研究、失败的实验和前驱模型
数据成本:训练数据集的获取和准备
人员:研究和工程团队的工资
基础设施:电力、冷却和维护
硬件:GPU 的实际成本(可能数亿)
一些分析师估计 DeepSeek-V3 的总研发预算可能约为 1 亿美元,更保守的估计为 DeepSeek 的运营每年在 5 亿美元到 10 亿美元之间。
Pilsung
2025-01-28 11:29:32没做过生意的纯技术宅男是不用考虑cost,只需要研究算法. LOL