文学城论坛
+A-

传Deepseek从chatGPT公开API获得了大量data用于模型训练,是这么回事吗?

方外居士 2025-01-29 15:08:43 ( reads)

跟帖(9)

dancinghorse

2025-01-29 15:21:19

在成品上再加点花头也不是不可能的事

方外居士

2025-01-29 15:38:09

可以节省许多训练data的准备时间。

老财主说两句

2025-01-29 15:38:47

微软说是窃取了他们的数据。就是一个抄袭的问题

方外居士

2025-01-29 15:44:59

这是一个很大的指控,性质很不一样。chatGPT的核心数据应该不是微软所能掌控的。微软只是发现有大量数据传输,不知是什么

金笔

2025-01-29 15:56:46

确切说,应该是DS也是付了很多费用给ChatGTP的。这是取巧罢了。

方外居士

2025-01-29 16:28:02

可能是从chatGPT获得了训练数据来训练模型。模型本身应该是全新的,否则不可能那那么少的成本训练成功。

精木

2025-01-29 16:35:55

FT 的报道说了很清楚,是OpenAI发现的,它正在用API在上面提炼(“蒸馏”)数据。但这违反服务条款,因为用户不得复

精木

2025-01-29 16:37:37

复制其任何服务或者使用其模型输出来开发与其OpenAI竞争的模型。

方外居士

2025-01-29 17:13:14

用数据做模式型训练也属于开发模型吗?