您的位置:首页 > 其它

【学习笔记】编译原理-有限自动机

2014-06-23 10:58 357 查看




一、定义:

不确定的有限自动机(NFA): 一种数学模型

(1) 一个有限的状态集合S

(2) 一个输入符号集合∑(不包含ε)

(3) 一个转换函数move: S X (∑ U {ε}) -> P(S)

(4) 状态s0是唯一的开始状态

(5) 状态集合F是接受状态集合,S包含F

确定的有限自动机(DFA): 是NFA的特殊情况

(1) 任何状态都没有ε转换

(2) 对于任何状态s和任何输入符号a,最多只有一条标记为a的边离开,即转换函数move: S X ∑-> S可以是一个部分函数。




二、表示:


1.NFA:


NFA可以用带标记的有向图表示,节点表示状态,有标记的边代表转换函数。

(a|b)*ab的NFA


(图1)
状态转换表

状态\输入字符ab
0{0,1}{0}
1ø{2}
2øø

2.DFA:


(a|b)*ab的DFA


(图2)




三、NFA到DFA:子集构造法


步骤


假设有(a|b)*ab的NFA图中


(图3)

第一步:由起始位置配ε可以到达的所有状态集合{0,1,2,4,7}作为DFA的起始状态A;

第二步:确定字母表{a,b}

第三步:可以画出DFA的转换表Dtran的模型,(*表示未确定)
状态\输入字符ab
A {0,1,2,4,7}**
第四步:寻找表中未确定项,例如[A,a],为该空确定转移状态,从图(1)可知集合A中的状态匹配输入字符a,可以转移到的状态集合为{1,2,3,4,6,7,8},该集合没有出现过,所以要在DFA的转换表Dtran的模型中加入该状态集。
状态\输入字符ab
A {0,1,2,4,7}B*
B {1,2,3,4,6,7,8}**
第五步:重复第四步,知道确定DFA的转换表Dtran
状态\输入字符ab
A {0,1,2,4,7}BC
B {1,2,3,4,6,7,8}BD
C {1,2,4,5,6,7}BC
D {1,2,4,5,6,7,9}BC
第六步:根据DFA转换表就可以画出DFA的状态图。

伪代码

Q    为处理的集合队列
s    起始状态集合
G    为转换表

S = getSet(s, ε); //获得起始状态集S

为S分配一个唯一的标识码,例如(0),对应到G;

将S加入队列Q;

while(Q不为空) {
U = Q.front(), Q.pop(); // 取队列中的首项处理

for (对于字母表中的每个字母) {
New = getSet(U, a); // a为当前考虑的字符,New为集合变量,接受处理得到的新集合

if (New == ø)
continue;

获得New集合的标识码,如果未出现,则在Q中加入New,并为New分配一个标识码。
G[U,New] = a;
}
}

对于getSet函数来说,给定一个集合U和匹配字符a,获得一个转移集合V,该函数需要注意边为ε的时候,因为NFA的边可以为ε。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: