您的位置：首页 > 大数据 > 人工智能

人工智能第二次作业

2017-10-22 16:43 225 查看

4.1（a,c,e）

a:

局部束搜索算法每次搜索时，当前k个状态产生所有后继状态，从中选出k个最佳状态。当k=1时，刚好是爬山法的搜索过程。即从当前最佳状态的所有后继状态中选择最优的一个。

c:

当T=0时，模拟退火算法达到最稳定状态的温度，此时任何更优的解都会被拒绝，因为当前是最稳定的状态，此时的状态就等同于处于应用爬山法而处于最优解的状态（局部最优或者全局最优），因为此时爬山法会拒绝任何更优解。

e:

当只有一个个体时，通过杂交之后，后代等同于父代的副本，由于有一个很小的概率会导致突变。因此该算发等同于个体随机突变的过程。

4.2

状态：连接块的集合，其中包括[-10，10]之间的对其误差；没有连接块的集合。

后继函数：可以任意连接和取消任一快。

目标状态：所有的部件都在同一个连接的轨道上，没有剩余的钉子或洞，没有重叠的轨道。

耗费函数：每一块铁轨的耗费，以及误差角度。

4.6

4.8

a: 证明：

假设目标状态b可以由信念状态b’通过某一行动序列得到。意味着b可以由b’中的某几个物理状态通过该序列得到，即b’中的物理物理状态要么是等于b，要么是可以通过该行动序列变成b。因此对于b’的某一子集，肯定可以通过该行动序列得到b。考虑吸尘器信念状态b’{5,3,7}和目标状态b{7}。b可以由b’通过行动序列S->R->S->L得到,b也可以由b’的子集得到。如下图：

因此，反过来也可以得证，即b的解，同样也是b的超集的解。

b:在扩展节点时，如果新节点是某一已经得到的节点的超集，则直接舍去。

c:记录已经求得的所有信念状态的集合，在开始或搜索时添加一个检查，以检查传入的信念状态是否先前解决的一个子集，如果存在，返回之前的解决方案，否则，添加节点。

4.10

说明：

对于稳定的吸尘器世界的无传感信息版本来说，Agent通过S行动可以得到新的信念状态，因此可以通过不断的行动，得到目标状态。对于不稳定的吸尘器世界来说，执行L和R之后，初始信念状态被分成2个互不相交的子集合，执行S之后，信念状态空间保持不变。因此所有的信念状态只能是三个状态空间中的一个，无论如何转换，都得不到目标状态。

5.7

证明：如果当前节点为MIN,且子节点为叶节点，如果MIN使用次优招数，那么MIN节点的值就会大于等于最优招数的值。该结果会反馈给MIN的父节点，使得父节点的值同样大于等于最优招数的值，不断回馈，最后的效用值不会比最优招数低。

博弈树：

5.11

a:国际象棋的评估函数：

其中是棋盘上每种棋子的数目，是每种棋子的价值。

b: α-β博弈Agent：

c:

增加搜索深度增加得到最优解的概率，但是会增加程序运行时间；改进行棋排序

可以提高α-β剪枝效率，提高程序性能；改进评估函数可以提高程序性能。

d:

伪代码：

B*与A*性能比较：

1、无障碍情况

此种情况，B*算法效率是普通A*的44倍。

2、线形障碍

此种情况，B*算法效率是普通A*的28倍。

3、环形障碍

此种情况，B*算法效率是普通A*的132倍。

4、封闭障碍（目标不可达）

此种情况，B*算法效率是普通A*的581倍。

5.13

a:

通过不断迭代，可以得到用nj表示的n1的值。

b:代入得：

通过不断迭代，可以得到用li,ri表示的n1的值。

c: 如果nj是一个最大节点，那么它的值的下限只会随着它的后继者被评估而增加。如果它超过lj，那么它的值对n1将无影响。并且，如果它的值超过(l2,l4,…lj)中的最小值，那么它的值对n1也没有影响。

d: 。

5.16

a:

b:

给定节点1-6，我们需要查看节点7,8.如果它们的值都是+∞，那么上面的最小节点和机会节点的值也将是+∞，最佳移动将改变。给定节点1-7，我们不需要查看节点8，就算节点8的值是+∞，最小节点的值将不会大于-1，机会节点的值不会大于0.5.最佳移动不会改变。

c:

最差的情况：第三或第四个节点叶节点的值都是-2，在这种情况下，上面机会节点的值都是0；最好的情况：第三或第四个节点的值是都是2，上面机会节点的值为2。所以取值范围是0-2。

d:

6.2

a: 棋盘上的n*n个格子。

b: 2种取值，{该格子被放置了马，没有放置}。

c: 值非空的变量，即被放置了马的格子受到约束；每一个放置了马的格子不能在任何其它放置了马的格子的攻击位置，即任意两个放置了马的格子都不能互相攻击。放置马的格子总数为K。

d: 确保任何时候都不会发生攻击。行动是移除任何骑士，在任何未被攻击的方块中添加一个骑士，或将一个骑士移动到任何未攻击的方块。

6.6

引入一个新变量，结构体A-B。A-B>=A，并且A-B>=B。

得到三个二元约束：

1 A-B的第一个元素的值大于等于A，小于等于A-B。

2 A-B的第二个元素的值大于等于B，小于等于A-B。

3 A-B的两个元素的值之后等于C。

6.8

0表示第一种颜色，1表示第二种，2表示第三种

1: A1=0

2: H=1

3: A4=0

4：F1=0

5：A2=2;

6：F2=0;

7: A3取任何值都会导致冲突，A2的冲突集为{A2,A4,H};

8: 回溯，A2的冲突集为{A1,A4,H}，A2没有可选颜色。

9: 回溯，A4的冲突集为{A1，H}，A4修改为2。

10：此时，冲突集为空。

11：A3=0

12：T=2

13：成功。

着色结果为：

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航