您的位置:首页 > 大数据 > 人工智能

Head-up No-Limit Texas Hold'em 计算搜索空间一探 (AI方向)

2018-01-03 17:23 471 查看
在最近10年,游戏行业开始被AI领域的研究专家所关注,主要的原因是游戏中涉及各类博弈(game-thoery), 逻辑思考和概率,比如围棋(GO)。这里我们想探究一下现在在AI研究领域比较活跃的游戏类型非完美信息游戏(Imperfect Info Game), Head-up No-Limit Texas Hold’em, 这个游戏较围棋等其他游戏不同之处在与,在游戏过程中有,玩家只有部分信息(玩家A不知道其他玩家的牌,预先不知后续的共有牌), 理论上在有筹码的情况下,玩家可以持续玩下去, 最后赢的人赢所有筹码 (zero-sum game)。如果有读者对游戏规则感兴趣可以查看这里 [1]。

为了不缺失通用性, 我们将讨论有2-3个玩家情况下,该游戏的计算/搜索空间, 这里统一假设agent是玩家A, 以下的搜索空间表示为,在给定玩家A, 特定的信息下,所有可能发生的牌面组合, 讨论可能发生所有牌面组合的意义在于后续确认在给定特定信息(牌面)下,玩家赢的概率, 牌共有(13 * 4=52张)

轮数玩家个数搜索空间计算逻辑搜索空间大小
First2C2501225
Second2C250∗C34821187600
Third2C250∗C348∗C145953442000
Fourth2C250∗C348∗C145∗C14441951448000
First3C250∗C2481381800
Second3C250∗C248∗C34620975724000
Third3C250∗C248∗C346∗C143901956132000
Fourth3C250∗C248∗C346∗C143∗C14237882157544000
这里的轮数代表玩家和共有牌面的情况:

轮数玩家手里牌数共有牌数
First20
Second23
Third24
Fourth25
当玩家人数增加,搜索空间成指数式上升,AI研究给定信息下(不完整信息)尝试通过新的算法来评估/近似 (如Counterfactual Regret Minimization [2]),选手选不同操作(raise, call, check等) 的期望或回报, 并帮助选手赢得比赛。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐