AI玩转德州扑克,对网络博彩业带来致命打击

AI玩转德州扑克,对网络博彩业带来致命打击

大河赌场

【AI世代编者按】人工智能研究最近取得的突破,引发了关于机器人是否会给网络博彩业构成威胁的质疑。

全球4名顶尖职业扑克玩家历经20天的鏖战,还是在美国匹兹堡的大河赌场(Rivers Casino)以失败收场。

比赛期间,他们会在上午11点前出现,身着运动裤和时尚的运动鞋,在电脑屏幕前坐下来。

在夜晚返回酒店之前,他们每天都需要玩1500手无限制德州扑克。这经常意味着他们需要打牌至晚上10点以后。

在一整天的时间里,星巴克咖啡和矿泉水就放在这几位牌手的键盘旁边,脚下则放着快餐袋。

当这些扑克玩家每一次做出动作时,这些动作都会被传输到位于5英里之外的卡耐基梅隆大学的一台计算机服务器。通过这台服务器,信号将被再传输12英里,至位于门罗维尔郊区匹兹堡超级计算机中心上运行的一款名为“Libratus”的软件。

Libratus同时玩8手牌--与每位选手同时玩两手牌。它从容不迫的做出决定,缓慢的速度让对手贾森·赖斯(Jason Les)几近疯狂。“它让时间变得更长,”赖斯说。“等待不应该影响我,但有时你会喜欢‘好吧,这是要结束了吗?’”

当然,Libratus永远不需要休息。在其它方面,它也不同于人类玩家。当投入更多的赌注时,人们倾向于思考更长的时间。Libratus在投入的筹码较少时玩的非常慢,因为手中有更多的筹码,它必须考虑到所有的可能性。Libratus还会违反标准投注习惯,突然加大筹码,不定时投入不规则数量的筹码。

对于人类扑克玩家来说,这样的行为是恼人的、鲁莽的,从长期来看也是代价高昂的。但是作为扑克玩家,Libratus的主要贡献就是它的无人性。

当为期20天的赛事在大河赌场结束时,职业扑克玩家合计输了180万美元。(事实上他们并不需要投入任何钱,这个数值只是在扑克比赛中用于计算得分。)

卡耐基梅隆大学负责开发Libratus的两位计算机科学家图奥马斯·桑德霍尔姆(Tuomas Sandholm)和诺姆·布朗(Noam Brown),对Libratus的获胜感到非常激动,因为这是计算机在全球最知名的扑克游戏--无限制德州扑克中首次击败顶尖职业扑克玩家。

人工智能领域的专家经常使用游戏,用于开发和测试他们的发明成果。计算机已在国际象棋、跳棋、双陆棋和围棋上击败了最好的人类棋手。因为机会的原因,以及玩家不知道他们的对手拿着什么样的牌,扑克成为了一项独特的挑战。所谓的不完美信息游戏需要一丝人类智慧,类似于欺骗对手,并能够察觉到被对手欺骗--这些都是电脑缺乏的。

《完美的赌注:科学和数学如何从赌博中获得好运》一书的作者亚当·库哈尔斯基(Adam Kucharski)指出,“经常能够看到无限制德州扑克的巡回赛,它更像是一门艺术,而不像是一门科学。曾经有一种想法认为,这个游戏在很长时间内不会受到计算机的影响。”

AI玩转德州扑克,对网络博彩业带来致命打击

诺姆·布朗过去五年一直在开发用于在扑克比赛中击败人类的人工智能

但是这种想法在最近几周变得土崩瓦解。上月初,阿尔伯塔大学的研究人员撰写了一篇基于他们开发的人工智能DeepStack与职业扑克玩家对抗赛的论文。

在这场对抗赛中,DeepStack击败了11位职业扑克玩家。这篇论文介绍了DeepStack,这是一种用于扑克这样的不完美信息环境的新算法。它结合了回归推理来处理信息不对称性,还结合了分解来把计算集中到相关的决策上,以及一种形式的关于任意牌的直觉--该直觉可以使用深度学习进行自我玩牌而自动学习。

有关DeepStack的表现是否优于Libratus是一个有争议的话题。桑德霍尔姆就表示,Libratus击败的职业扑克玩家要比DeepStack击败的玩家更优秀。阿尔伯塔大学计算机项目负责人迈克尔·鲍林(Michael Bowling)承认了这一点。但他质疑职业扑克玩家能否保持相同的巅峰状态连续比赛近一个月时间,而且DeepStack的胜率是Libratus的三倍。

不过桑德霍尔姆和鲍林都认为,扑克人工智能仅仅是刚跨越了一道重要的门槛,对他们来说这与扑克本身无关。德州扑克仅是他们为自己的人工智能程序寻找对练的途径之一。

通过游戏机器人学习到的经验将被应用到网络安全等应用程序当中。桑德霍尔姆说,“这是人工智能社区早已设定的主要基准,这些算法并会单独提供给扑克玩家。它们是通用的。”外表与比尔·盖茨(Bill Gates)有几分相似的的桑德霍尔姆,曾是全球最顶尖的帆板运动员之一。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://9796qp.com/a/jingyan/962.html