知乎上有个业余棋手说让计算机围棋九子,还能重复赢。不知是真是假。
那位大概就是设计如何测试程序的, 知道AI 的软肋。
他公布的方法不复杂,直觉性很强
如果, alphago 马上把输的结果归纳进测试程序进行再训练, AI 就补上了那个缺陷。
如果这样不能解决问题, 那么 alphago 设计有缺陷。这样的反馈学习成本非常高。
据说是知道了上次的错误,光凭此经验仍可能不知道正确的走法,除非训练过程作大的改变
WaldenPond
2023-03-23 20:27:51那位大概就是设计如何测试程序的, 知道AI 的软肋。