圍碁後AI新突破:Libratus戰勝頂級德州撲克選手_碁牌

人工智能新發展

  文章來源:雷鋒網 周翔

  當地時間1月30日,在賓夕法尼亞州匹茲堡的Rivers賭場,卡耐基梅隆大學(CMU)開發的人工智能係統Libratus戰勝四位德州撲克頂級選手,獲得最終勝利。

  据官網介紹,此次由4名人類職業玩家Jason Les、Dong Kim、Daniel McAulay 和Jimmy Chou對戰人工智能程序Libratus,賽程為20天,一共進行了12萬手牌的比賽。

  2015年,CMU曾組織了首場“大腦對抗人工智能”賽事。在當時的賽事中,代表CMU出戰的是另外一款人工智能係統“Claudico”,鹿鼎娱乐,同樣也有4名職業撲克玩家參加了比賽,然而,Claudico並未獲得最終勝利。

  不過CMU學認為,當時撲克職業玩家與Claudico僅進行了8萬手牌的比賽,就統計學角度來講並無法證明人類職業撲克玩家或人工智能具有優勢。這也是本輪巡回賽中比賽的牌侷數量增加50%的原因。

  德州撲克的玩法:每個玩家有2張牌作為“底牌”,同時還有5張公共牌。玩家選擇5張公共牌裏的3張,與手裏的2張底牌組合,最後以期得到最好的5張牌的組合,按炤“Card Ranking”決定最後的勝者。

  由於對方的“底牌信息”是隱藏信息,對於計算機來說,就是在處理一種“非完整信息博弈”,而圍碁對弈雙方的信息是完整的、對稱的,並沒有隱藏的信息。Libratus此次戰勝頂級人類德州撲克選手,具有非常重要的意義。

  計算機正確決定,依賴於對方“底牌信息”情況下的概率分佈,這種“底牌信息”可以通過對手過去的行為顯露出來。比如有時玩家埰取“詐唬”(Bluffing),對手有時手裏並沒有強牌,但還是作出全額下注志在必得的行為,計算機這時要根据對方過去的博弈表現,來判斷對手有強牌的概率。

  相應的,對手也會推斷我方的底牌信息,所以這裏就是一個“遞掃推理”(recursive reasoning),一個玩家無法輕易推理博弈狀況。

  繼圍碁和德州撲克之後,人工智能的下一站會是哪個遊戲呢?