您的位置:首页 > 其它

手工打造编译器之词法分析器3

2010-10-04 16:28 141 查看

1.6.1 生成逆波兰表达式

逆波兰表达式,可以去除括号(),建立适合计算机处理的表达式,该表达式有正确的运算优先级。
正常的表达式 逆波兰表达式
  a+b ---> a,b,+
  a+(b-c) ---> a,b,c,-,+
  a+(b-c)*d ---> a,b,c,-,d,*,+
  a+d*(b-c)--->a,d,b,c,-,*,+
a=1+3 ---> a=1,3 +
运算的时候,遇到可以归并的就归并计算。如5+(4-3)*2
5,4,3,-,2,*,+, 4,3,-可以归并,变为
5 1 2 * +, 1 2 *可以归并,变为
5 2 + 5 2 +可以归并,变为
7, 是最终结果

1.6.1.1 正则表达式各符号的优先级

Alternation 0
Concatenation 1
单目运算符有最高的优先级,且它们优先级相同
? * + 2

1.6.1.2生成逆波兰表达式的算法

(1)首先构造一个运算符栈,此运算符在栈内遵循越往栈顶优先级越高的原则。
  (2)从左至右扫描该算术表达式,从第一个字符开始判断,如果是字符集,则将该字符集直接输出。
  (3)如果不是数字,该字符则是运算符,此时需比较优先关系。
做法如下:将该字符与运算符栈顶的运算符的优先关系相比较。如果,该字符优先关系高于此运算符栈顶的运算符,则将该运算符入栈。倘若不是的话,则将栈顶的运算符从栈中弹出,直到栈顶运算符的优先级低于当前运算符,将该字符入栈。
特殊处理:左括号(直接入栈; 如果是右括号),出栈知道遇到左括号(,并将(出栈。
(4)重复上述操作(3)-(4)直至扫描完整个简单算术表达式,确定所有字符都得到正确处理,我们便可以将中缀式表示的简单算术表达式转化为逆波兰表示的简单算术表达式。

1.6.1.3 组装有限自动机




如上图蓝色表示初始状态所在的表达式,红色表示终态所在的表达式。M,N,P,Q表示正则表达式。
(a),一个字符集;
(b),一个表达式是MN,另一个是PQ,MN和PQ的可选(alternation)的运算;
(c),N?,零个或一个
(d), 一个表达式是MN,另一个是PQ,MN和PQ的联合(concatenation)的运算;
(e),N*,零个或多个
(f),N+,一个或多个
[title2]1.7 字符串判别的例子[/title2]

[_a-zA-Z][_a-zA-Z0-9]*
[0-9]*
([0-9]+/.[0-9]*)|
([0-9]*/.[0-9]+)
_dd
yes
No
No
_ijuy*jj
No
No
No
_
yes
No
No
0asss
No
No
No
a0234jl____
yes
No
No
067
No
yes
No
890
No
yes
No
0.1
No
No
Yes
00.5
No
No
Yes
55.
No
No
Yes
.1
No
No
Yes
.
no
No
No

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: