微软 AI「Suphx」挑战日本麻将,成功登上天凤十段

热度:436℃
微软 AI「Suphx」挑战日本麻将,成功登上天凤十段

继 AlphaGo 之后,人工智慧已在无数的游戏领域击败人类,而微软亚洲研究院(MSRA)打造的 AI 系统「Super Phoenix」(Suphx),近期也在人们相当熟悉的游戏崭露头角:麻将。

与围棋等棋类游戏不同,麻将是典型的不完美资讯(Imperfect Information)游戏,玩家在整场游戏都无法掌握许多资讯,他们必须考虑对手手上未知的牌来决定如何弃牌及虚张声势,出牌顺序还可能因碰槓改变。

除此之外,以 Suphx 主要训练的日本麻将规则为例,游戏常常以半庄为单位进行,这意味着一场游戏包含 8 局,结束后得比较 8 局总得分才能分出排名,AI 得因应不断变动的局势调整策略,这种複杂的奖励机制可说进一步提高推理和决策水準的需求。

微软亚洲研究院院长洪小文表示,好的麻将玩家得依靠观察、直觉、战略、计算和机会的组合,这也为 AI 系统带来独特的挑战。

「麻将比其他棋盘游戏更複杂,玩法既是艺术也是科学」。

为了让 Suphx 能与人类玩家切磋中学习,研究团队在今年 3 月开始让 Suphx 登上日本麻将游戏平台「天凤」(Tenhou)与人对战。

截至 6 月,Suphx 参与近 5,000 场牌局,从中找到自己的游戏风格,学会如何在攻击和防御打法间找到平衡,战略性权衡短期损失与长期收益,并使用模糊的数据做决策。

通过天凤的段位竞赛后,Suphx 现在已有专家级麻将玩家水準,成为第一个进入天凤十段排名的 AI 系统,即使是网站注册的 30 万名人类玩家也只有 180 人左右曾经做到。

微软 AI「Suphx」挑战日本麻将,成功登上天凤十段微软 AI「Suphx」挑战日本麻将,成功登上天凤十段 Suphx 经常在牌局表现良好,但偶尔也是会放枪。

但这并不意味着 Suphx 就能像 AlphaGo Master 从此战无不胜;与围棋不同,麻将仍有不小运气成分存在,即使是精于计算的 AI 也无法完全掌握随机性,只能尝试做到最好。

有趣的是,就像 AlphaGo 为围棋选手带来全新思路,Suphx 的独特打牌风格也在网路引起不小风潮,日本职业雀士、被天凤誉为「日本麻将最强玩家」的朝仓康心便曾在推特表示,看完 Suphx 的对局后,有种看到隐士高手的感觉。

「稍微看了 suphx 的对局,有种《猎人》漫画尼特罗会长看到尼飞彼多的感觉。」

6 月初达到 10 段后,研究团队宣布 Suphx 将「入场维修」,暂时停止与玩家对战,待系统调整完后会再展开麻将之旅。究竟 Suphx 出关后会不会再有惊人突破,相当值得期待。