gpt4 book ai didi

algorithm - table 游AI的参数优化

转载 作者:塔克拉玛干 更新时间:2023-11-03 06:15:10 28 4
gpt4 key购买 nike

我创建了一个可以玩黑白棋的小型 AI 程序。我使用的算法 (MCTS UTC) 有一个参数,我可以在其中调整探索与开发比率。这是从 0 到 10 的单个浮点值(无穷大是可能的,但高值没有多大意义)

我可以很容易地让算法与这个参数的不同值进行对抗。这会让我知道这两个值中哪个更好。

优化这个参数有什么好的算法?

(我更喜欢有一些研究或出版物的算法,以深入了解为什么或何时最有效。)

最佳答案

考虑一些类似于遗传算法的东西,其中程序与自身进行游戏并且获胜者比例保持不变,并且略有不同。跟踪值。随着时间的推移,它可能会收敛到“最佳”平衡。

关于algorithm - table 游AI的参数优化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42094657/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com