打败人类扑克玩家,卡内基美隆大学开发赌神 AI

打败人类扑克玩家,卡内基美隆大学开发赌神 AI

雷锋网消息:当地时间 1 月 30 日,在宾夕法尼亚州匹兹堡的 Rivers 赌场,卡内基美隆大学(CMU)开发的人工智慧系统 Libratus 战胜四位德州扑克顶级选手,获得最终胜利。

据官网介绍,此次由 4 名人类职业玩家 Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou 对战人工智慧程序 Libratus,赛程为 20 天,一共进行了 12 万手牌的比赛。

2015 年,CMU 曾组织了首场「大脑对抗人工智慧」赛事。在当时的赛事中,代表 CMU 出战的是另外一款人工智慧系统“Claudico”,同样也有 4 名职业扑克玩家参加了比赛,然而,Claudico 并未获得最终胜利。

不过 CMU 大学认为,当时扑克职业玩家与 Claudico 仅进行了 8 万手牌的比赛,就统计学角度来讲并无法证明人类职业扑克玩家或人工智慧具有优势。这也是本轮巡回赛中比赛的牌局数量增加 50%的原因。

德州扑克的玩法:每个玩家有 2 张牌作为「底牌」,同时还有 5 张公共牌。玩家用自己的 2 张底牌和 5 张公共牌结合在一起,选出 5 张牌,不论手中的牌使用几张(甚至可以不用手中的底牌),凑成最大的成牌,跟其他玩家比大小。按照“Card Ranking”决定最后的胜者。

由于对方的「底牌信息」是隐藏信息,对于计算机来说,就是在处理一种「非完整信息博弈」。而围棋对弈双方的信息是完整的、对称的,并没有隐藏的信息。Libratus 此次战胜顶级人类德州扑克选手,具有非常重要的意义。

计算机正确决定,依赖于对方「底牌信息」情况下的概率分布,这种「底牌信息」可以通过对手过去的行为显露出来。比如有时玩家採取「诈唬」(Bluffing),对手有时手里并没有强牌,但还是作出全额下注志在必得的行为,计算机这时要根据对方过去的博弈表现,来判断对手有强牌的概率。

相应的,对手也会推断我方的底牌信息,所以这里就是一个「递归推理」(recursive reasoning),一个玩家无法轻易推理博弈状况。
继围棋和德州扑克之后,人工智慧的下一站会是哪个游戏呢?

延伸阅读

神秘棋手「Master」击败各国棋王,创 40 连胜纪录
Alpha Go 将挑战《星海争霸 2》,当人工智慧也能秒反应,代表人类智力正被步步逼近
神经科学家看 AlphaGo:即便人脑弱点重重,也无法被 AI 取代