您的位置：首页 > 大数据 > 人工智能

Head-up No-Limit Texas Hold'em 计算搜索空间一探 (AI方向)

2018-01-03 17:23 471 查看

在最近10年，游戏行业开始被AI领域的研究专家所关注，主要的原因是游戏中涉及各类博弈(game-thoery), 逻辑思考和概率，比如围棋(GO)。这里我们想探究一下现在在AI研究领域比较活跃的游戏类型非完美信息游戏(Imperfect Info Game), Head-up No-Limit Texas Hold’em，这个游戏较围棋等其他游戏不同之处在与，在游戏过程中有，玩家只有部分信息(玩家A不知道其他玩家的牌，预先不知后续的共有牌), 理论上在有筹码的情况下，玩家可以持续玩下去, 最后赢的人赢所有筹码 (zero-sum game)。如果有读者对游戏规则感兴趣可以查看这里 [1]。

为了不缺失通用性, 我们将讨论有2-3个玩家情况下，该游戏的计算/搜索空间, 这里统一假设agent是玩家A, 以下的搜索空间表示为，在给定玩家A, 特定的信息下，所有可能发生的牌面组合, 讨论可能发生所有牌面组合的意义在于后续确认在给定特定信息（牌面）下，玩家赢的概率, 牌共有(13 * 4=52张)

轮数	玩家个数	搜索空间计算逻辑	搜索空间大小
First	2	C250	1225
Second	2	C250∗C348	21187600
Third	2	C250∗C348∗C145	953442000
Fourth	2	C250∗C348∗C145∗C144	41951448000
First	3	C250∗C248	1381800
Second	3	C250∗C248∗C346	20975724000
Third	3	C250∗C248∗C346∗C143	901956132000
Fourth	3	C250∗C248∗C346∗C143∗C142	37882157544000

这里的轮数代表玩家和共有牌面的情况:

轮数	玩家手里牌数	共有牌数
First	2	0
Second	2	3
Third	2	4
Fourth	2	5

当玩家人数增加，搜索空间成指数式上升，AI研究给定信息下（不完整信息）尝试通过新的算法来评估/近似 (如Counterfactual Regret Minimization [2])，选手选不同操作(raise, call, check等) 的期望或回报, 并帮助选手赢得比赛。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航