蒸馏?那就更没有原汁原味了。谢谢补充。没有花时间研究它,只是觉得DeepSeek不会靠谱而已。。。!
蒸馏是指从用大模型比如DeepSeek R1去训练参数少的小模型,从而得到8B,14B,32B等等对资源要求较少的版本。
金笔
2025-01-26 21:57:51蒸馏?那就更没有原汁原味了。谢谢补充。没有花时间研究它,只是觉得DeepSeek不会靠谱而已。。。!