百分之一忘却的遗迹玩法攻略
百分之一忘却的遗迹玩法攻略如下:
我是许我再少年,今天带来的是忘却的遗迹玩法的讨论。
这个模式就是有回合限制的三消。4连不消耗回合,5连增加一个回合。
三消游戏是一个典型的“game”场景,在机器学习领域,对于最优玩法,简单的game可以通过“搜索”得到,复杂一些的game可以通过强化学习(reinforcement learning)得到。
先说这个模式的自动机制。它的逻辑就是单步收益最大化的贪心算法,笼统来说,属于最简单的“搜索”策略。收益的定义也比较简单,有多消优先多消,没多消优先高等级的宝石。试过自动的容易发现,这个“AI”的效果比较差。
先岔一下话题,其实对战模式的自动“AI”的策略和这个贪心算法没区别,具体大家都试过不再展开。但是对战模式下的AI其实还行,这是因为卡牌的技能对战局影响非常大。一个是输出伤害,一个是刷新棋盘。这使得消除的最佳策略基本接近于单次贪心搜索,考虑多轮消除几乎不可能,另一个因为共用棋盘,这个场景其实是博弈场景,而非决策。博弈的核心是预判对手的预判,最终找到纳什均衡点。而决策只需要根据环境搞收益最大化。本来博弈场景应该更难做ai,但就是因为卡牌的角色比较重,反而使得最优消除策略比普通三消要简单不少。当然,这个AI水平也不行,比如:
-不考虑当下的全部棋盘,比如三消引发其他位置的四消
-攻击宝石三连普通宝石优先带一个高阶宝石的情况(这就是程序的问题)
回到遗迹模式,上述逻辑主要想论证为什么同样的贪心策略在这个看似简单的三消模式中效果更差。那么最优策略怎么找?熟悉RL的读者应该很容易想到办法,本质上和alphaGo下围棋类似。需要设计一些奖励原则,使得整体reward最大化,显然回合数最大化是比较合理的选择,具体拆分可以举一些例子,比如:
- 5消最高优
- 单步的reward考虑移动宝石后所有棋盘上的消除宝石数量,而不只是移动的宝石
- 消除数量多一点比较好
- 高阶宝石应该向底部或者四周移动,避免卡住多消
- 每种类型宝石的reward根据当前棋盘总体宝石分布而定,但总的来说是越高阶宝石越碍事
- 4消的价值没有那么大,特别是位于顶部的时候
以上是我尝试过的原则。当然,因为人脑对于细节的计算是很费力的,所以我打了很多次排名也不算高。人脑善于设计模糊原则,在精确优化方面,还是弄个rl模型比较OK
如果官方能开放api或者模拟器就好了,可以外包给我做模型。不然还得自己搞模拟器,而且直接放到游戏操作里也很麻烦,没准被当外挂给封了。
下面是我的战绩
可以看到我和第一还是有差距的,不过排行榜前面的人大多应该都退了,也侧面说明这个模式的难度其实并没有那么低
以上就是百分之一忘却的遗迹玩法攻略相关内容。