Head-up No-Limit Texas Hold'em 计算搜索空间一探 (AI方向)
2018-01-03 17:23
471 查看
在最近10年,游戏行业开始被AI领域的研究专家所关注,主要的原因是游戏中涉及各类博弈(game-thoery), 逻辑思考和概率,比如围棋(GO)。这里我们想探究一下现在在AI研究领域比较活跃的游戏类型非完美信息游戏(Imperfect Info Game), Head-up No-Limit Texas Hold’em, 这个游戏较围棋等其他游戏不同之处在与,在游戏过程中有,玩家只有部分信息(玩家A不知道其他玩家的牌,预先不知后续的共有牌), 理论上在有筹码的情况下,玩家可以持续玩下去, 最后赢的人赢所有筹码 (zero-sum game)。如果有读者对游戏规则感兴趣可以查看这里 [1]。
为了不缺失通用性, 我们将讨论有2-3个玩家情况下,该游戏的计算/搜索空间, 这里统一假设agent是玩家A, 以下的搜索空间表示为,在给定玩家A, 特定的信息下,所有可能发生的牌面组合, 讨论可能发生所有牌面组合的意义在于后续确认在给定特定信息(牌面)下,玩家赢的概率, 牌共有(13 * 4=52张)
这里的轮数代表玩家和共有牌面的情况:
当玩家人数增加,搜索空间成指数式上升,AI研究给定信息下(不完整信息)尝试通过新的算法来评估/近似 (如Counterfactual Regret Minimization [2]),选手选不同操作(raise, call, check等) 的期望或回报, 并帮助选手赢得比赛。
为了不缺失通用性, 我们将讨论有2-3个玩家情况下,该游戏的计算/搜索空间, 这里统一假设agent是玩家A, 以下的搜索空间表示为,在给定玩家A, 特定的信息下,所有可能发生的牌面组合, 讨论可能发生所有牌面组合的意义在于后续确认在给定特定信息(牌面)下,玩家赢的概率, 牌共有(13 * 4=52张)
轮数 | 玩家个数 | 搜索空间计算逻辑 | 搜索空间大小 |
First | 2 | C250 | 1225 |
Second | 2 | C250∗C348 | 21187600 |
Third | 2 | C250∗C348∗C145 | 953442000 |
Fourth | 2 | C250∗C348∗C145∗C144 | 41951448000 |
First | 3 | C250∗C248 | 1381800 |
Second | 3 | C250∗C248∗C346 | 20975724000 |
Third | 3 | C250∗C248∗C346∗C143 | 901956132000 |
Fourth | 3 | C250∗C248∗C346∗C143∗C142 | 37882157544000 |
轮数 | 玩家手里牌数 | 共有牌数 |
First | 2 | 0 |
Second | 2 | 3 |
Third | 2 | 4 |
Fourth | 2 | 5 |
相关文章推荐
- Lucene in action 笔记 term vector——针对特定field建立的词频向量空间,不存!不会!影响搜索,其作用是告诉我们搜索结果是“如何”匹配的,用以提供高亮、计算相似度,在VSM模型中评分计算
- 使3D空间中物体朝向和其速度方向一致的旋转矩阵计算方案
- 数值计算A Star not a Tree? (八个方向搜索中心坐标点)
- 图像处理之计算连通区域的角度方向
- -XX:-UseGCOverheadLimit 参数 java.lang.OutOfMemoryError:GC overhead limit exceeded填坑心得
- 搜索背后的奥秘——浅谈语义主题计算
- Shader自学笔记 3.2.1 用切线空间计算法线纹理
- JVM调优--计算对象占用的空间
- 解决git 提交代码时提示空间不足:error: unpack failed: error No space left on device
- 【opencv】双目视觉下空间坐标计算/双目测距 6/13更新
- 11.leetcode Container With Most Water(medium)[分析规律减少搜索空间]
- 计算时间复杂度&空间复杂度
- Limit the textbox only can be inputed with number and paste no more than 9 chars
- 视频特性TI(时间信息)和SI(空间信息)的计算工具:TIandSI
- There is no sound when MessageBox pops up after updating code to the new 7.1
- zabbix——计算所需数据库空间
- 暴力搜索内存空间获得 Api 的线性地址
- 88、展示Tensorflow计算图上每个节点的基本信息以及运行时消耗的时间和空间
- 如何计算Java对象占用了多少空间?
- 空间点到直线垂足坐标的计算方法