词法分析器的工作过程分析
2016-04-04 14:26
218 查看
Webkit中。有个词法分析器--HTMLTokenizer,她是怎么工作的呢。网页字节流是她的输入。她的输出是一个个的词语Token,比方div,input,img。script等等HTML文件里的标准元素(Element)。
前一篇文章关于DOM的创建里说过,HTML元字符解析器(HTMLMetaChractorParser)和HTML词法分析器(HTMLTokenizer)协同工作,一起分析、解析出词语(HTMLMetaChractorParser取出全部的页面中的字符。并调用HTMLTokenizer的nextToken函数处理它):
以下这张图。就是Tokenizer详细的工作过程。我们看的出来。她是个状态机,先取<,再取>,就表示一个词语(token)结束了,之后进入下一个状态。周而复始。
前一篇文章关于DOM的创建里说过,HTML元字符解析器(HTMLMetaChractorParser)和HTML词法分析器(HTMLTokenizer)协同工作,一起分析、解析出词语(HTMLMetaChractorParser取出全部的页面中的字符。并调用HTMLTokenizer的nextToken函数处理它):
以下这张图。就是Tokenizer详细的工作过程。我们看的出来。她是个状态机,先取<,再取>,就表示一个词语(token)结束了,之后进入下一个状态。周而复始。
相关文章推荐
- 数据库优化-基准測试(一)
- static用法小结
- XHTML简介
- 序列化
- vs2012 编译jrtplib 和jthread以及配置
- ArrayList源码解读
- Android Gradle Plugin指南(六)——高级构建定制
- [原创] hadoop学习笔记:卸载和安装jdk
- feel
- 【v2.x OGE教程 19】 引擎状态控制
- 又见拦截导弹
- Android Gradle Plugin指南(五)——Build Variants(构建变种版本)
- 使用Maven下载jar包
- 简单用法小结
- ubuntu下 adb打印LOG详细用法
- nyoj51
- Pojo和JavaBean的区别(转载)
- 动态分配内存和链表
- 共同学习Java源码--常用数据类型--String(九)
- hdu 5379 Mahjong tree 树形DP入门