文学城论坛
+A-

早上看到有个帖问Data Science专业

加州lalin 2024-09-16 17:18:00 ( reads)

今天在GenAI有关的会议,有个专场讲到今后趋势。今天GenAI需要的数据,80%靠data science engineer, 20%靠工具,趋势是80%靠LLM,20%靠engineer。

喜欢CS,专业还是CS好。
data science 专业慎重。

一家之言,仅供参考。

==================================================================================

虽然主贴说了一家之言,也难免有争议。在紫檀说话不容易,特别是适用普娃,不适用牛娃的话。牛娃之所以是牛娃,任它风吹草动,永远都能成功。对普娃来说,减少信息差,打破信息壁垒,也是一种有效的风险控制。家有普娃,更甚有酱油普娃,对此深有感触。

=== 把后面的跟帖提上来

=== CS是不是也没用?AI都能生成code了

现如今最火的AI,属于GenAI(Generative AI)的类别,比如CHATGPT。GenAI严重依靠海量的数据和数据的准确度。这就是为什么Chatgpt可以写文章,因为可靠的用来学习的文章是海量,从有出版开始到今天网络,有几百年的文章都可以用来学习和参考。为什么AI可以写code?因为开源代码的存在,各种考编程的题库,还有各种论坛中讨论和分享的code。有题库就有答案,有成功项目的source code就能够判断什么是可行的code,这些都是可靠数据,可以用来学习判断,可以AI化。还有为什么AI考Step One可以通过,是一样的道理。Step One考试,依靠是现存的知识,特别是记忆的比重还是很大的。

那么AI真可以替代CS吗?目前还没看到。每家公司的应用有大众性的场景也有特殊的场景,大众场景的AI可能可以提供,这是基于既然是大众场景,那么场景数据也是大众的,可得到的,可判断的,而且够多够海量。但是特殊场景AI没有可依靠的大量数据用来学习,这还是需要人工来思考设计。

这里做CS的不少,过去三十年,在CS field还做30年前同样技术的,真是如熊猫般稀有啊。我清点一下自己早期做过事,现在的CS孩子估计听都没听说过,比如AS400,比如听得到哒哒哒信息传输的IBM token ring, 比如有个叫PASCAL的古董编程语言。同样,三十年前的我,也不可能知道今天的ChatGPT,BARD, Bedrock的运行原理。CS从业就是不停的跟着技术,紧跟技术的步伐。新人入行入到就行。以后靠个人努力。CS行业需求永远是存在的,只是我们没有水晶球,可以看到未来。一个技术的淘汰,总有几十个新技术诞生。

如果在DS火的时候,选这个专业顺利毕业入了行,即使这个职位没了,自然有新的职位可以转。而现在在高中的孩子,知道一下趋势,还是有用的。

 

===============================================================================

Data Science 作为正式的本科专业是非常短的时间。2018前后,各大TOP University才相继开出这个专业,然后遍地开花。而第一批DS专业的孩子毕业时,大数据红利已接近尾声。我们幸运的是,大数据泡沫没有爆。市场充足的资金,让这个新技术直接无缝连接到GenAI。 在大数据红火的时候,MIT和Standford都是最早提供相关的Online program(Coursera - S 和 edX - MIT)

然,DS本身发展速度非常快,淘汰的也快,比如Hadoop,眼看他起高楼,眼看他楼倒了。DS类知识,更合适用提供即时紧跟技术的选修课或者是给从业的技术人员,更新技术培训的方式,而不是一个新本科专业的设立。当然这只是我个人意见。MIT好像至今都没有DS专业,但是有很多相关课程。Standard有DS专业,但好像在统计大类之下。(由ChatGPT 提供)

再强调,对牛娃来说,任他风吹雨打,我自横牛。所以就读各TOP XX DS专业的牛娃都无妨!牛娃父母可以轻松ByPass本帖。呵呵。。。。。。

普娃选专业,请慎重考虑。自谦类普娃请参看上面一行。

跟帖(24)

加州lalin

2024-09-16 17:21:00

今天遇到不同公司行业,几乎都在印度扩大SWE开发部门

我是谁的谁

2024-09-16 17:27:50

Tech就跟30年前的制造业一样,都在外移,大美帝国越来越中空,搞不好以后除了政府工就是吃救济的

加州lalin

2024-09-16 17:47:00

和Cost有关。dot com 破灭前,SWE也是out source。那时公司找不到人,认识code都拉来上班。

加州lalin

2024-09-16 17:49:00

那时只有做system稳,不会out source。 后来硬件网络突破,风水反转。系统维护out source,SWE本土

加州lalin

2024-09-16 17:50:00

疫情期间,各大公司囤积人才,导致SWE又贵又找不到。out source又流行起来。

加州lalin

2024-09-16 17:53:00

来回折腾中向前发展。所以,读书还是要读核心。

加州lalin

2024-09-16 17:57:00

一个PM可以管10个本地SWE。out source 同样的工作量要3个PM管。都是钱决定的

加州lalin

2024-09-16 17:24:00

我从这个专业设立第一天就不看好。像以前的MIS

gezhu

2024-09-16 22:53:48

同感

Q22

2024-09-17 13:38:59

+100! 同感!

闻风

2024-09-16 17:27:41

Data Science 是一个简化过的CS + Statistics Double Major。如果能

加州lalin

2024-09-16 17:41:00

现在还行。看这趋势,DS工作可能会减少。不如扎扎实实读CS。

jenda123

2024-09-16 17:45:03

还是应用数学是基础,目前看来不可能被淘汰

jenda123

2024-09-16 17:50:24

基础打牢,可以搞点Double major 或者Minor

jenda123

2024-09-16 17:53:22

BTW,我家在大学里

jenda123

2024-09-16 17:54:44

应数就是难,但是课不多,干其他有非常多时间。

Pilsung

2024-09-16 18:27:05

据说DS的本科编程能力不如CS或是SWE.如果是搞ML那块,又得有PHD水平才行.

两女宝妈

2024-09-16 17:43:10

那不就是应用数学+CS嘛

闻风

2024-09-16 18:08:04

不一样。应用数学的方向多了去了。

加州lalin

2024-09-16 17:33:00

今天对GenAI的感觉就是,要烧很多钱。

hhtt

2024-09-16 17:58:00

老留家长就是功利!念计划一定要有用赚钱?百分之八十在大学里学的,不会用到!但是大学是一个训练营,教你如何着问题,发现问题,然后用

加州lalin

2024-09-16 18:01:00

所以大学就不该开DS专业。

jenda123

2024-09-16 18:13:17

Totally agree. 大学就是学一个基本知识和解决问题的能力。

其乐无穷

2024-09-16 18:12:54

CS还不是一样?前两天不是说AI写码可以beat 80%的码工?所以今后想冒头十有八九需要博士才成。