文学城论坛
+A-

从谷歌Gemini失利,谈中国DeepSeek到底是中草药还是AI利器?

金笔 2025-01-26 21:00:32 ( reads)

上一篇我说到:中美在人工智能领域里的竞争实际上就是西药和中草药的竞争!有人不服气说中国的DeepSeek需要更少很多的电力(俗话:轻快),因而具有更为先进的算法,可以跟美国最为先进的OpenAI媲美或更好。

真的是这样吗?

人工智能,说到底就是模拟人的大脑。我们知道人脑的智慧(智力)取决于两个方面:记忆力(或记忆量)以及“闪存”(即获取和解读记忆的速度滤过能力)来决定的。

在OpenAI上线以前,我们知道谷歌,脸书,特斯拉以及微软(OpenAI)之间的竞争是很激烈的。但当OpenAI推出以后,这个号称收集了2022年为止的所有数据库(图书,资料,Internet等),而训练出来的人工智能ChatGPT开始面向市场以后,实际上这个竞争就已经结束了。注意,OpenAI训练时使用的数据库,基本都是免费的。

当ChatGPT开始推出收费服务,所有的数据库都开始收费了。即使富有多钱的公司,如谷歌,脸书等,实际上也无法购买和支付所有这些数据库了,太昂贵了。因此人工智能的训练,即向它喂资料就变的很局限了。这也就是为什么马斯克和OpenAI的CEO翻脸的原因(骂他是骗子等)。因为OpenAI即没有公布他们的算法,还推出了收费服务。这就实际上阻碍了AI界的继续竞争,也阻碍了AI的发展。结论:ChatGPT的模式变得不可重复。

现在AI的竞争主要局限在专业的公司间了,如ChatGPT,Cloude等。如果没有大量的资料库来充实和支撑,人工智能实际上还是一台电脑。

那么再说中国推出的DeepSeek,它区区的五百万美金,能够喂食多少资料呢?

据说它很轻快(所谓算法先进?),但实际上就很说明问题。DeepSeek要读取的记忆量可能就很小。

那么,你们说它的人工智能AI会高到哪里去呢?

跟帖(10)

越活越有劲

2025-01-26 21:19:26

Bingo! 击中要害,厉害!数据库。对的。数据库收费,那也就是数据收费了。以后再搞到免费的数据就难了。这个就像人脑一

金笔

2025-01-26 21:24:00

呵呵,终于有人赞同我的了~!

kl3527

2025-01-26 21:43:00

用“蒸馏”过的数据,直接上RL,省了pre-taining ,是大胆,也算是“二次开发”。当然省时省钱。

金笔

2025-01-26 21:57:51

蒸馏?那就更没有原汁原味了。谢谢补充。没有花时间研究它,只是觉得DeepSeek不会靠谱而已。。。!

监考老师

2025-01-26 22:55:17

蒸馏是指从用大模型比如DeepSeek R1去训练参数少的小模型,从而得到8B,14B,32B等等对资源要求较少的版本。

小八腊子2

2025-01-27 10:50:13

看AI所实现的方向。如果是推理性的,数据大小并不重要。好比google 的alphaZero战胜AlphaGo并不是通过

破棉袄

2025-01-27 13:28:04

DeepSeek没有从原数据开始,是用现存的开源模型,可能还蹭了ChatGPT的input/output

oldpp

2025-01-27 20:52:05

同意~

ahhhh

2025-01-27 19:46:50

数据库?GOOGLE早就定时存互联网数据了。

busboy

2025-01-27 22:39:33

GOOGLE的数据集如何?就算不和OpenAI比,比Claude都差。