2023-06-30 22:34:10 来源:互联网 作者:小狐狸
《拳皇98》、《街头霸王》、《死或生》……一干童年回忆全都玩了个遍,其中还有号称要打5000场才能入门的3D格斗游戏《铁拳》:
没错,就是那个对新手极不友好的《铁拳》,随便拉一张角色的搓招表感受一下这个复杂度:
(没错,各种压帧判定的JF技就是其特色之一)
△铁拳 TT2出招表
但AI偏偏就能在入坑没多久就通关了最高难度:
△左侧为AI
这款AI的背后是一位个人开发者,也是一位骨灰级的街机游戏爱好者。
他训练出来的新手“铁匠”在Reddit的“比赛录播”已经有近500的热度:
强化学习训练框架
这位AI铁匠的背后,是一个叫做DIAMBRA Arena的强化学习交互框架。
DIAMBRA Arena提供了多个强化学习研究和实验环境,具有情节性的强化学习任务,由离散的动作(如游戏手柄按钮)和屏幕中的像素和数据(如人物血条)组成。
在这一框架中,智能体会向环境发送一个动作,环境对其进行处理,并相应地将一个起始状态转换为新状态,再将观察和奖励返回给智能体,以此交互循环:
要实现上述循环的代码也非常简单:
而这款AI的“实战场”为早期的Tekken Tag Tournament,当然,搓招复杂度完全不逊色于之后的新版本……
开发者选择了风间仁(Jin)和吉光(Yoshimitsu)两名具有代表性的角色作为主要操作对象。
输入分别为:从RGB转换为灰度,并缩小到128 x 128px的游戏屏幕像素值、对战局数(Stage)、人物血条、游戏界面的一侧。
训练中的奖励是一个基于生命值的函数,如果对方生命值损伤则得到正面奖励,己方控制的角色生命值损失则得到负面惩罚。
同时,AI的动作速率也被限定为最大速率的1/10,即游戏中每6步发送一个动作。
由于框架使用的是一种离散的动作空间,因此,智能体在训练中的同一时间只能选择一个移动动作9向上,向下等)或攻击动作(冲击,踢,出拳)。
因此,虽然一个连击组合的实战能力更强,但由于AI无法同时点击两个动作,在真实的对战中,便会出现AI频繁使用踢(Kick)和更换角色(swap)两个动作的情况:
现在,开发者团队已经开始正式筹备这个“AI游戏锦标赛”,背后的程序员和开发者们相当于是“教练”或者“选手家长”,最终的获胜者可获得1400瑞士法郎(折合人民币9261元)。
“比赛项目”也不止是铁拳一种,开发者表示,这些格斗游戏的底层机制都比较类似,只需要修改一下组合技、人物血条数值等游戏的差异性属性。
所以,他们的DIAMBRA Arena框架面向各类街机视频游戏提供完全符合OpenAI Gym标准的Python API。
像死或生、街头霸王等多个流行的街机游戏都被囊括其中:
喋血街头2攻略 喋血街头2攻略怎么骑人
06-22 1街头篮球手游的技能特效功能使用方法介绍
07-01 2喋血街头3攻略秘籍 视频教程及注册码详解
06-30 5《街头篮球》小前锋怎么玩 小前锋玩法攻略
11-29 38街头篮球手游pg技能加点攻略 pg技能怎么选最好
06-12 40《街头篮球》FSPL职业组大混战
12-22 3街头足球中场怎么玩 中场玩法思路多种核心小技巧分享
11-06 32跑跑卡丁车手游在纽约街头狂飙的同时搜寻宝藏怎么完成_在纽约街头狂飙宝藏位置介绍
07-20 2《街头篮球》小前锋怎么玩 《街头篮球》小前锋玩法攻略
11-30 33手游街头篮球皇叔攻略 街头篮球皇叔抢不到板
04-21 20lol冰霜女巫怎么玩 英雄联盟万金油中单冰霜女巫详细攻略
06-30 13兽人必须死2mod汉化教程 无法存档和音效问题解决
06-30 5海加尔山掉落装备一览表 BOSS及T几拳套防骑装备详细介绍
06-30 91九阴真经徐家庄攻略 入门条件及出师条件等门派划分
06-30 14孤岛惊魂2最低配置要求 3-6笔记本显卡i3内存及难度详解
06-30 3死魂曲新生解说设定 4和2关卡隐藏剧情详解
06-30 0原神九条裟罗武器和圣遗物搭配2023 平民4星满命圣遗物推荐
06-30 14灭国英雄地图修改编辑器 三部曲战役攻略及秘籍大全
06-30 37无主之地2狂战士加点顺序 技能加点及必备神器
06-30 41LOL披甲龙龟出装 披甲龙龟怎么出装伤害最高
06-30 4