击败冷扑大师仍有10%胜算 AI偶尔会犯蠢错误

时间:2017-04-08 23:06来源:未知作者:luluzuo

亚洲首次扑克人机大战,冷扑大师vs中国龙之队人机扑克巅峰表演赛现在已经进行到第三天,目前冷扑大师共领先412792记分牌。冷扑大师这一波貌似有点稳啊,但是在4月7日比赛后的采访中,龙之队队长杜悦表示虽然目前暂时落后,但基于德州扑克这个项目不确定性,龙之队还是有10%的胜利可能的,朱亚希则分享了一些比赛中的趣事,AI有时会犯一些人类看起来有些愚蠢的有趣错误。

 

 

杜悦称:“AI就像一个技术非常高,而且不会“上头”的顶尖牌手,我是把它假想成这样一个人类对手。其实这几天的成绩,我们也分析了下,具体到每场比赛,AI分别对我们的队员,也都有“水上”、“水下”。今天下午虽然输了不少,但我们也是有两位队员在水上的。只是AI在水下的时候,也不会输很多;而我们队员经常在水下很深的位置。想把AI打成一个碾压的结果非常难,而我们人类在落后的时候很难做到心如止水。”

 

 

朱亚希表示:“如果是人类对手他可能会有一些固定的习惯,我们会根据这些习惯做针对性的策略。但AI似乎都是根据计算,很难摸清固定的套路。我们现在的打法是,抓AI一些细节处理上的不细腻,而且AI会犯一些在我们人类看来很愚蠢的错误。”

 

“冷扑大师”是基于卡内基梅隆大学(Carnegie Mellon University)TuomasSandholm教授和博士生Noam Brown所开发的Libratus无限扑克人工智能系统,扑克机器人的研发基础基于博弈论,并且结合了大量的数学和概率,扑克程序在赛前不曾研拟历史牌谱,直接在比赛同时动态优化胜率最高的数学模型,利用战略推理揭露玩家底牌的隐藏信息,从而建构出智能化的AI谈判策略套路。

 

 

但扑克是“不完全信息博弈”,AI看不到对手手里的牌、也无法准确预测对手的记分牌策略。一个好的徳扑玩家,会根据出牌的序列、对手的风格、对手的位置和记分牌深度等等因素来反推对手手中的牌,从而精确计算各自的胜率。对于AI来说,要想模仿类似的思考分析能力难度并不小。

 

它是在不断成长中,但是中国龙之队也在不断摸索中,寻找它的BUG,去年李世石在人机大战中赢过一次AlphaGo,这可能就是因为李世石触发了AlphaGo的一个BUG。而这次,一切可说不定呢。

 

冷扑大师目前只能进行每局重置筹码的1V1比赛,人类德扑比赛常见的多人桌赛制,它暂时还不能挑战。

 

每位牌手面前有两个电脑,因为冷扑大师打牌速度较慢,人类可以同时打两副牌,时间上完全来得及。据了解冷扑大师采用完全数学的模型和算法,后台的计算机群计算量非常之大。所以目前情况来看,人类打牌的速度比AI快不少。

 

具体到每局比赛都采用1V1单挑的模式,而且每局重置筹码。每局开始时,每位牌手有20000的筹码,大盲注100,小盲注50。这手牌打完之后,无论结果如何,下一局双方的筹码都要重置回20000。

 

这样的方式在某种意义上降低了电脑方面的难度,手中筹码量的不同,在打牌策略上也会有很大变化。而目前的冷扑大师还无法做到在不同筹码量的前提下,与人类对抗,因为初始等量筹码和不等量筹码在数学模型的建立上有本质上的区别。

 

按照开发者卡内基•梅隆大学计算机科学学院院长安德鲁•摩尔的说法:“德州扑克中最考验牌手技术的反而是双人对战,如果有更多牌手的话,其他牌手间的技术差别反而会被利用。”

 

从技术层面这种说法也有一定道理,但德州扑克比赛,多人赛制是常态,而且偶然因素更多,也更加刺激。从基础策略模型的角度上分析,多人赛制和现在单挑的模式有本质上的不同。

 

这次比赛只是德扑人机大战的第一步,如果有一天冷扑大师能够在多人比赛中从头打到底,完美应对不同筹码量的问题,那么我们才敢说,人工智能在德州扑克项目上已经击败了人类。

 

(本文部分内容摘自:新浪体育)

--> -->