那个业余围棋手胜了十四盘。当然完全一样的局面,计算机第二次会知道上次走错了,但未必知道该怎么走赢
那位大概就是设计如何测试程序的, 知道AI 的软肋。
他公布的方法不复杂,直觉性很强
如果, alphago 马上把输的结果归纳进测试程序进行再训练, AI 就补上了那个缺陷。
如果这样不能解决问题, 那么 alphago 设计有缺陷。这样的反馈学习成本非常高。
据说是知道了上次的错误,光凭此经验仍可能不知道正确的走法,除非训练过程作大的改变
ScottGu
2023-03-23 20:25:10那个业余围棋手胜了十四盘。当然完全一样的局面,计算机第二次会知道上次走错了,但未必知道该怎么走赢