python解释器实现以及嵌入式应用:符号表以及语法检查
2017-02-20 14:54
447 查看
本章实现了独立的符号表,实现了赋值语句语法检查。
换言之[推论]:不能通过first集推导的就是epsilon规则。
对于epsilon规则,应用follow集合来确认接下来要应用哪个产生式。
这是理论上的说法,那末要如何转换成代码呢?
first集合
这个很直白,就是条件判断语句(例如if/else)。假设first集合为first(alpha)={a,b},那么可以这么实现:
follow集合
注意上面的first集合中的else以及关于epsilon规则的推论。
很明显,如果执行到了else,则说明当前字符应当去follow集中匹配来确定应用哪一条产生式。
譬如11章的代码:
归纳总结
总结下来first集和follow集在代码上的实现其实也很简单,首先通过条件判断遍历first集进行推导,当遇到epsilon(上面的else)的时候,再通过条件判断遍历follow集(例如这里只有SEMI)进行推导。一种实现形式就是本章的代码。
相关的入口是
在遍历的时候对遇到的语句进行对应的符号表操作,例如
除了符号表相关的其他部分就是前面几个章节的内容了。
谈谈first集和follow集
几乎任何一本关于编译器设计的书在讲到语法分析的时候都会介绍first集合和follow集合,故名思议,first集合就是通过向前读取一个标识符,判断这个标识符是否且仅是某一产生式右侧符号的第一个标识符,如果是的话,就可以推断要应用该条规则进行推导。follow集指当前标识符是否是某一条规则的后面一个符号,对于LL(1)来讲,每条规则都能通过first集合进行推导,除了epsilon规则。换言之[推论]:不能通过first集推导的就是epsilon规则。
对于epsilon规则,应用follow集合来确认接下来要应用哪个产生式。
这是理论上的说法,那末要如何转换成代码呢?
first集合
这个很直白,就是条件判断语句(例如if/else)。假设first集合为first(alpha)={a,b},那么可以这么实现:
if current_token == a: match production_a elif current_token == b: match production_b else: ...
follow集合
注意上面的first集合中的else以及关于epsilon规则的推论。
很明显,如果执行到了else,则说明当前字符应当去follow集中匹配来确定应用哪一条产生式。
譬如11章的代码:
def statement_list(self): """ statement_list : statement | statement SEMI statement_list """ node = self.statement() results = [node] // 这个SEMI就是follow集中的元素 while self.current_token.type == SEMI: self.eat(SEMI) results.append(self.statement()) return results def statement(self): """ statement : compound_statement | assignment_statement | empty """ if self.current_token.type == BEGIN: node = self.compound_statement() elif self.current_token.type == ID: node = self.assignment_statement() else: node = self.empty() return node
归纳总结
总结下来first集和follow集在代码上的实现其实也很简单,首先通过条件判断遍历first集进行推导,当遇到epsilon(上面的else)的时候,再通过条件判断遍历follow集(例如这里只有SEMI)进行推导。一种实现形式就是本章的代码。
本章内容总结
本章添加了符号表,其实结构上和解释器遍历抽象语法树的过程是一样的,只不过通过字典保留了符号信息,并且进行了一定的语法检查。相关的入口是
symtab_builder = SymbolTableBuilder() symtab_builder.visit(tree)
在遍历的时候对遇到的语句进行对应的符号表操作,例如
# 遇到变量声明语句的时候,在符号表中添加对应的symbol def visit_VarDecl(self, node): type_name = node.type_node.value type_symbol = self.symtab.lookup(type_name) var_name = node.var_node.value var_symbol = VarSymbol(var_name, type_symbol) self.symtab.define(var_symbol) # 遇到赋值语句的时候,检查左侧变量是否已经声明 def visit_Assign(self, node): var_name = node.left.value var_symbol = self.symtab.lookup(var_name) if var_symbol is None: raise NameError(repr(var_name)) self.visit(node.right)
除了符号表相关的其他部分就是前面几个章节的内容了。
相关文章推荐
- python解释器实现及其嵌入式应用:内部模块定义及扩展
- python解释器实现及其嵌入式应用:实现语法支持
- python解释器实现及其嵌入式应用:认识Micro Python
- python解释器实现及其嵌入式应用:1到6章总结
- python解释器实现及其嵌入式应用:Let's Build a Simple Interpreter(part12)
- ARM7在嵌入式应用中启动程序的实现
- C#基础系列:实现自己的ORM(反射以及Attribute在ORM中的应用)
- Google Hacking 的实现以及应用
- 使用Log4j为项目配置日志输出应用详解以及示例演示的实现分析
- Google Hacking的实现以及应用
- jQuery.API源码深入剖析以及应用实现(3) - 选择器篇(上)
- 在RH9.0+vmware 5.xx上从开始到最后实现spca5xx驱动的安装 以及 嵌入式板上的驱动移植
- Google Hacking 的实现以及应用
- jQuery.API源码深入剖析以及应用实现(1) - 核心函数篇
- jQuery.API源码深入剖析以及应用实现(1) - 核心函数篇
- jQuery.API源码深入剖析以及应用实现(2) - jQuery对象访问和数据缓存
- 堆栈的应用(1) 平衡符号 C++实现
- Groovy MOP实现mini-language 如传说中Java7.0的XML嵌入式语法
- google hacking的实现以及应用
- ARM7在嵌入式应用中启动程序的实现