据说是知道了上次的错误,光凭此经验仍可能不知道正确的走法,除非训练过程作大的改变
ScottGu
2023-03-23 21:51:11
( reads)
网上对此原因有些分析。AlphaGo Zero是without human knowledge。如果训练过程作针对性改变,就是输入了human knowledge。
网上对此原因有些分析。AlphaGo Zero是without human knowledge。如果训练过程作针对性改变,就是输入了human knowledge。