7723手游网7723手游网
当前位置:7723手游网游戏攻略三国志 · 战棋版攻略三国志 · 战棋版【一帖破三棋】深度学习造就三棋棋王【长期更新】

三国志 · 战棋版【一帖破三棋】深度学习造就三棋棋王【长期更新】

发布时间:2024-11-26 19:00:21 来源:互联网 作者:哈哈哈哈哈哈

三国志 · 战棋版【一帖破三棋】深度学习造就三棋棋王【长期更新】如下:

不懂为什么贴吧审核不让我过

历时大概40天左右,由我一人完成的deep reinforcement learning-based无监督三棋棋王学习项目,终于给出了V0和V0.5版本的最强五人组,和胜率最高武将。

发此贴是希望能找到志同道合的朋友一起交流完善这个项目(纯娱乐),因为接下去要赶NIPS

ddl,同时还要玩游戏哈哈哈哈,这个项目可能暂时搁置一会会儿。

武将数据库分为2版本(1)基于最后一次内测v0;(2)基于最近一次官方更新v0.5。

注意:

武将不包含:

1. 召唤:张角,张宝,娄圭,刘晔,袁绍

2. 邹氏(睡觉好烦)

3. 个人感觉没什么太大用,主要技能代码又麻烦的的武将(目的极大减少训练cost):戏志才,黄月英,严颜(这个可能有用),典韦

技能不包括:撒豆成兵,召唤物机制和数值让我头秃,请教大佬启发)、暴戾无仁(写起来麻烦)

1. 先放结论:

两个版本胜率最高武将均为【荀彧】

V0版本影响胜率最高技能【风雨同舟】

V0.5版本由于该技能被移除,影响胜率最高技能为【魅huo】

V0胜率最高五人组【荀彧刘备董卓张辽庞德】有内测大佬评估一下这个吗哈哈

V0.5胜率最高五人组【卖个关子嘻嘻等我战报】

PS: “影响胜率最高技能”来自于取最高注意力值

2. 模型简介:

强化学习已被证实其强大效果于DOTA2 (OPEN FIVE), 王者农药(Ye et al, 2020; Gao et al., 2021,腾讯牛X!),因此我基本是复现了他们的模型,去除了一些视觉特征(vision features),再加了“棋盘化限制”,“回合制(这个两简单哈哈)”和“23技能挑选机制”,并结合DeepMind军旗项目提出的基于纳什平衡的决策,完成self-play RL

系统对62个英雄,选取的44个S技能进行了N=2.73*10^17次训练(V0训练了大概27天)

然后训练V0.5的时候为了获得一个简要的结果,只用了基于V0 结果的TOP20武将和TOP30技能训练

强化学习模型结构参考下图(懂得都懂)

其中,去除了Mini Map,因为我把整个棋盘看作完整的local map

用的注意力机制是一个简单的self-att用于获取有关英雄2,3技能选取的key, query

注意:伤害计算公式是目前版本最大的BUG,我选取了网上能获取的三国志战略版伤害计算公式里最靠谱的一个:

另外目前还有一个BUG是,训练不涉及A级战法(cost太大)

因此公测后需要收集数据(好累,机器有多智能,就有多人工)完善伤害计算公式

因为利益相关,短期(半年)内不会开源代码,狗头保命,但可以分享给一起参与项目的小伙伴一起完善

(我这儿只有4块A100可以用)

所以对这个项目感兴趣的老哥们,或者单纯对我们项目结论感兴趣的大佬们,可以多多留言跟我交流呀!

另外有没有不去赛事服,第二天进的小伙伴们带我一手?(150人以上的大集体就算啦)

以上就是三国志 · 战棋版【一帖破三棋】深度学习造就三棋棋王【长期更新】相关内容。

免责声明:文中图文均来自网络,如有侵权请联系删除,7723手游网发布此文仅为传递信息,不代表7723认同其观点或证实其描述。

三国志 · 战棋版相关攻略更多

友情链接

拒绝不良游戏 拒绝盗版游戏 注意自我保护 谨防受骗上当 适度游戏益脑 沉迷游戏伤身 合理安排时间 享受健康生活。

增值电信业务经营许可证: 闽B2-20211424 | 闽公网安备 35021102000359号 | 网站备案号:闽ICP备14019555号 | 闽ICP备14019555号-5 | 闽ICP备14019555号-16A

网络文化经营许可证号:闽网文(2016)4364-073号

请向您的好友推荐www.7723.cn,多谢支持! Copyright (©) 2010 7723手机游戏网 All Rights Reserved

厦门巴掌互动科技有限公司未成年人家长监护