您的位置:首页 > 大数据 > 人工智能

人工智能第二次作业

2017-10-22 16:43 225 查看
4.1(a,c,e)

a:

局部束搜索算法每次搜索时,当前k个状态产生所有后继状态,从中选出k个最佳状态。当k=1时,刚好是爬山法的搜索过程。即从当前最佳状态的所有后继状态中选择最优的一个。

c:

当T=0时,模拟退火算法达到最稳定状态的温度,此时任何更优的解都会被拒绝,因为当前是最稳定的状态,此时的状态就等同于处于应用爬山法而处于最优解的状态(局部最优或者全局最优),因为此时爬山法会拒绝任何更优解。

e:

当只有一个个体时,通过杂交之后,后代等同于父代的副本,由于有一个很小的概率会导致突变。因此该算发等同于个体随机突变的过程。

4.2

状态:连接块的集合,其中包括[-10,10]之间的对其误差;没有连接块的集合。

后继函数:可以任意连接和取消任一快。

目标状态:所有的部件都在同一个连接的轨道上,没有剩余的钉子或洞,没有重叠的轨道。

耗费函数:每一块铁轨的耗费,以及误差角度。

4.6



4.8

a: 证明:

假设目标状态b可以由信念状态b’通过某一行动序列得到。意味着b可以由b’中的某几个物理状态通过该序列得到,即b’中的物理物理状态要么是等于b,要么是可以通过该行动序列变成b。因此对于b’的某一子集,肯定可以通过该行动序列得到b。考虑吸尘器信念状态b’{5,3,7}和目标状态b{7}。b可以由b’通过行动序列S->R->S->L得到,b也可以由b’的子集得到。如下图:



因此,反过来也可以得证,即b的解,同样也是b的超集的解。

b:在扩展节点时,如果新节点是某一已经得到的节点的超集,则直接舍去。

c:记录已经求得的所有信念状态的集合,在开始或搜索时添加一个检查,以检查传入的信念状态是否先前解决的一个子集,如果存在,返回之前的解决方案,否则,添加节点。

4.10



说明:

对于稳定的吸尘器世界的无传感信息版本来说,Agent通过S行动可以得到新的信念状态,因此可以通过不断的行动,得到目标状态。对于不稳定的吸尘器世界来说,执行L和R之后,初始信念状态被分成2个互不相交的子集合,执行S之后,信念状态空间保持不变。因此所有的信念状态只能是三个状态空间中的一个,无论如何转换,都得不到目标状态。

5.7

证明:如果当前节点为MIN,且子节点为叶节点,如果MIN使用次优招数,那么MIN节点的值就会大于等于最优招数的值。该结果会反馈给MIN的父节点,使得父节点的值同样大于等于最优招数的值,不断回馈,最后的效用值不会比最优招数低。

博弈树:



5.11

a:国际象棋的评估函数:

其中 是棋盘上每种棋子的数目,是每种棋子的价值。

b: α-β博弈Agent:



c:

增加搜索深度增加得到最优解的概率,但是会增加程序运行时间;改进行棋排序

可以提高α-β剪枝效率,提高程序性能;改进评估函数可以提高程序性能。

d:

伪代码:



B*与A*性能比较:

1、无障碍情况

此种情况,B*算法效率是普通A*的44倍。

2、线形障碍

此种情况,B*算法效率是普通A*的28倍。

3、环形障碍

此种情况,B*算法效率是普通A*的132倍。

4、封闭障碍(目标不可达)

此种情况,B*算法效率是普通A*的581倍。

5.13

a:


通过不断迭代,可以得到用nj表示的n1的值。

b:代入得:



通过不断迭代,可以得到用li,ri表示的n1的值。

c: 如果nj是一个最大节点,那么它的值的下限只会随着它的后继者被评估而增加。如果它超过lj,那么它的值对n1将无影响。并且,如果它的值超过(l2,l4,…lj)中的最小值,那么它的值对n1也没有影响。

d: 。


5.16

a:



b:

给定节点1-6,我们需要查看节点7,8.如果它们的值都是+∞,那么上面的最小节点和机会节点的值也将是+∞,最佳移动将改变。给定节点1-7,我们不需要查看节点8,就算节点8的值是+∞,最小节点的值将不会大于-1,机会节点的值不会大于0.5.最佳移动不会改变。

c:

最差的情况:第三或第四个节点叶节点的值都是-2,在这种情况下,上面机会节点的值都是0;最好的情况:第三或第四个节点的值是都是2,上面机会节点的值为2。所以取值范围是0-2。

d:



6.2

a: 棋盘上的n*n个格子。

b: 2种取值,{该格子被放置了马,没有放置}。

c: 值非空的变量,即被放置了马的格子受到约束;每一个放置了马的格子不能在任何其它放置了马的格子的攻击位置,即任意两个放置了马的格子都不能互相攻击。放置马的格子总数为K。

d: 确保任何时候都不会发生攻击。行动是移除任何骑士,在任何未被攻击的方块中添加一个骑士,或将一个骑士移动到任何未攻击的方块。

6.6

引入一个新变量,结构体A-B。A-B>=A,并且A-B>=B。

得到三个二元约束:

1 A-B的第一个元素的值大于等于A,小于等于A-B。

2 A-B的第二个元素的值大于等于B,小于等于A-B。

3 A-B的两个元素的值之后等于C。

6.8

0表示第一种颜色,1表示第二种,2表示第三种

1: A1=0

2: H=1

3: A4=0

4:F1=0

5:A2=2;

6:F2=0;

7: A3取任何值都会导致冲突,A2的冲突集为{A2,A4,H};

8: 回溯,A2的冲突集为{A1,A4,H},A2没有可选颜色。

9: 回溯,A4的冲突集为{A1,H},A4修改为2。

10:此时,冲突集为空。

11:A3=0

12:T=2

13:成功。

着色结果为:

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: