您的位置：首页 > 理论基础 > 数据结构算法

【编译原理】第二章一个简单的语法制导翻译器

2012-05-01 17:44 204 查看

一，语法定义

        1）文法：对语言结构的定义与描述。即从形式上用于描述和规定语言结构的称为“文法”（或称为“语法”），而未

涉及语义问题。

                                  例：有一句子：“我是大学生” 。这是一个在语法、语义上都正确的句子，该句子的结构（称为语法结构）是由它的语法决定的。在本例中它为“主谓结构”

       2）文法定义

                文法G=（Vn，Vt，P，Z）

                        Vn：非终结符号集，语法变量

                         Vt：终结符号集，词法单元

                          P：产生式或规则的集合

                           Z：开始符号（识别符号） Z∈Vn

           例：if(expression)   statement else statement;

                   关键字if 和括号：为终结符号(词法单元)

                  expression、statement：非终结符号

3）推导

从一个要识别的符号开始推导,即用相应规则的右部来替代规则的左部,每次仅用一条规则去进行推导。从开始符号出发，不断将某个非终结符号替换为该非终结符号的某个产生式的体。

  <句子>::=<主语><谓语>

<主语>::=<代词>|<名词>

<代词> ::=你|我|他

<名词>::= 王民|大学生|工人|英语

<谓语>::=<动词><直接宾语>

<动词>::=是|学习

<直接宾语>::=<代词>|<名词>

4）语法分析

接受一个终结符号串作为输入，找出从文法的开始符号推导出这个串的方法。如果不能从文法符号推到得到该终结符号串，则报错。

5）语法分析树

语法分析树被定义为具有下述性质的一棵树：

1）根由开始符号所标记；

2）每个叶子由一个终结符、非终结符、或ε标记；

3）每个内部结点由一个非终结符标记；

4）若A是某内部节点的标记，且X1，X2，...，Xn是该节点从左到右所有孩子的标记，则A→X1X2...Xn是一个产生式。若A→ε，则标记为A的结点可以仅有一个标记为ε的孩子。

例子：9-5+2

文法的产生式：list -> list + digit ;

list -> list - digit ;

list -> digit

digit -> 0 | 1| 2| 3| 4| 5| 6| 7| 8| 9

非终结符：list digit list是文法开始符号

终结符：零个或多个终结符号组成的序列，零个终结符组成的串称为空串

语法分析树：

list

/ | \

list | digit

/ | \ | |

list | digit | |

| | | | |

9 - 5 + 2

6）二义性

一个文法可能有多颗语法分析树，生成同一个给定的终结符号。

例子：句子id+id*id可能的分析树

(id+id)*id id+id*id

消除二义性：

① 改写二义文法为非二义文法；

② 规定二义文法中符号的优先级和结合性，使仅产生一棵分析树。

  二义文法的优点：

① 比非二义文法容易理解；

② 分析效率高（分析树低，直接推导步骤少）。

三，语法制导翻译

1）属性：与某个程序构造相关的任意的量，属性可以使多种多样的，比如表达式的数据类型、生成的代码中的指令数目或为某个生成的代码中第一条指令的位置。

2）翻译方案：将程序片段附加到一个文法的各个产生式上的表示法。当在语法分析过程中使用一个产生式时，相应的程序片段就会执行。

3）语法制导定义：把①每个文法符号和一个属性集合相关联，并且把 ② 每个产生式和一组语义规则相关联，这些规则用于计算与该产生式中符号相关联的属性值

四，语法分析

1）语法分析：决定如何使用一个文法生成一个终结符号串的过程。原则上语法分析器必须能够构造出语法分析树，否则将无法保证翻译的正确性

2）语法分析分为：自顶向下分析方法和自底向上分析方法

3）自顶向下分析方法：构造方法从根节点开始，逐步向叶子节点方向进行。

4）预测分析法（递归下降分析法）：自顶向下的语法分析方法，使用一组递归过程来处理输入。

五，简单表达式的翻译器

1）抽象语法树：每个内部节点代表一个运算符（而不像语法分析树为非终结符号）

2）将中缀表达式翻译成后缀表达式：

package demo_parser;
import java.io.*;

public class Demo_Parser {
static int lookahead;//字节流以整数形式（ascii码中对应十进制数）表示
public Demo_Parser() throws IOException
{
lookahead=System.in.read();//read方法以字节流的方式来读取命令行的输入的数据
}
void term() throws  IOException  //如果是数字则输出(不识别字母)
{
if(Character.isDigit((char)lookahead))
{
System.out.write((char)lookahead);
match(lookahead);
}
else throw new Error("syntax error");
}
void match(int t)throws  IOException
{
if(lookahead == t)
lookahead= System.in.read();
else
throw new Error("syntax error");
}
void expr() throws IOException
{
term();
while(true)
{
if(lookahead =='+')
{
match('+');
term();
System.out.write('+');
}
else if(lookahead == '-')
{
match('-');
term();
System.out.write('-');
}
else return;
}
}

public static void main(String[] args) throws IOException{

Demo_Parser parser = new Demo_Parser();
parser.expr();
System.out.write('\n');
}
}

六，词法分析

1）从输入中读取字符，并将它们组成”词法单元对象“。构成一个词法单元的输入字符序列成为词素。

2）剔除空白和注释：实现这个远非易事

3）预读：比如读到 then 还要往下读，如果是空格或其他非标识符则判断为关键字。否则为标识符(thenOther)

<= >= == <>

4）识别关键字和标识符：词法分析采用一个表来保存字符串

七，符号表

1）符号表：一种供编译器用于保存有关源程序构造的各种信息的数据结构。这些信息在编译器的分析阶段被逐步手机并放入符号表。

2）符号表条目：在分析阶段由，词法分析器、语法分析器和语义分析器创建并使用。语法分析器创建。

3）每个作用域设置一个符号表，其作用是将信息从声明的地方传递到实际使用的地方。

八，生成中间代码

1）两种中间表示形式：树形结构，线性表示形式（特别是"三地址代码"）

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： list 编译器数据结构语言 string class

相关文章推荐

新的分享

章节导航

【编译原理】第二章 一个简单的语法制导翻译器

【编译原理】第二章一个简单的语法制导翻译器