如果, alphago 马上把输的结果归纳进测试程序进行再训练, AI 就补上了那个缺陷。
如果这样不能解决问题, 那么 alphago 设计有缺陷。这样的反馈学习成本非常高。
据说是知道了上次的错误,光凭此经验仍可能不知道正确的走法,除非训练过程作大的改变
WaldenPond
2023-03-23 20:44:27如果, alphago 马上把输的结果归纳进测试程序进行再训练, AI 就补上了那个缺陷。