Tomasulo算法
2016-05-11 22:37
302 查看
Tomasulo算法:为IBM 360/91设计的,它采用的是寄存器重命名的方法来消除寄存器数据流之间的假相关,即用虚拟寄存器集代替真实的FPR,虚拟寄存器集在tomasulo算法中由每一功能单元所带的保留站(reservation
station)、取数缓冲区(load buffers)和存数缓冲区(store buffers)组成。
Tomasulo算法的三段
1.Issue―从FP Op Queue中取出指令。
如果保留站空闲(无结构冒险),控制机制发射指令&发送操作数(对寄存器进行换名)。
2.Execution―对操作数执行操作(EX)
如果两个操作数都已就绪,就执行;如果没有就绪,就观测公共数据总线等待所需结果
3.Write result―完成执行(WB)
通过公共数据总线(CDB)将结果写入到所有等待的部件;标记保留站可用
![](http://img.blog.csdn.net/20160511223601429?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
IBM360/91的FPU分为加法器和乘除两个子功能单元。FLOS在两个功能单元的保留站有位置时将指令发生到相应保留站,并为输出分配相应重命名寄存器并标记,如果此时需要的源数据已经准备好则直接从相应寄存器送到保留站对应位置,等待功能单元空闲即运行,如果源数据没准备好,则在保留站对应区域设置指向该数据寄存器的指针,等数据准备好,则直接通过CDB总线送到保留站,而不需等待数据写回寄存器。
![](http://img.blog.csdn.net/20160511223627279?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
![](http://img.blog.csdn.net/20160511223638086?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
![](http://img.blog.csdn.net/20160511223658633?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
加上加法部件执行需要两个周期,乘除部件需要3个周期。
第一个周期,因为两个功能部件的保留站均有空闲位置,因此发射两条指令分别到两个功能单元,并设置好FLR相应标签位和为输出FLR分配重命名寄存器,这里因为x的源数据在FLR中已经准备好,所以直接将数据放入保留站相应位置,而w指令的源数据来源于R4,此时R4为忙,标签为x的输出对应保留站的ID=1,所以设置相应标签为1,即x指令对应的保留站号。
第二个周期,保留站有空位,仍然发射两条指令到相应位置。同样设置源操作数标签。为FLR4和FLR8设置标签和分配重命名寄存器。由于FLR4标签在前一个周期已经被设置从指向x,即1,需要更新为指向y,即2,即y指令的结果更新FLR4。该周期末,x执行完毕,计算结果通过CDB总线送到w和y指令的相应区域。
第三个周期,w和y开始执行。
第四个周期,y指令执行。
第五个周期,周期末,y执行完毕,数据通过CDB送到z指令,同时更新FLR。
第六个周期,指令x执行完毕,在总线CDB上广播,z和FLR2中相关标签命中,更新相应区域,z开始执行。z指令在低八个周期结束。
ps1:保留站的标签设置是根据FLR标签的值来设置的,在把指令发送到保留站时先设置源操作标签,再设置FLR标签。
ps2:采用这种算法,寄存器R4的内容在出现输出相关时可能漏掉中间数据,例如指令w的结果在R4中不会出现,因此存在不能精确异常定位问题。
station)、取数缓冲区(load buffers)和存数缓冲区(store buffers)组成。
Tomasulo算法的三段
1.Issue―从FP Op Queue中取出指令。
如果保留站空闲(无结构冒险),控制机制发射指令&发送操作数(对寄存器进行换名)。
2.Execution―对操作数执行操作(EX)
如果两个操作数都已就绪,就执行;如果没有就绪,就观测公共数据总线等待所需结果
3.Write result―完成执行(WB)
通过公共数据总线(CDB)将结果写入到所有等待的部件;标记保留站可用
IBM360/91的FPU分为加法器和乘除两个子功能单元。FLOS在两个功能单元的保留站有位置时将指令发生到相应保留站,并为输出分配相应重命名寄存器并标记,如果此时需要的源数据已经准备好则直接从相应寄存器送到保留站对应位置,等待功能单元空闲即运行,如果源数据没准备好,则在保留站对应区域设置指向该数据寄存器的指针,等数据准备好,则直接通过CDB总线送到保留站,而不需等待数据写回寄存器。
加上加法部件执行需要两个周期,乘除部件需要3个周期。
第一个周期,因为两个功能部件的保留站均有空闲位置,因此发射两条指令分别到两个功能单元,并设置好FLR相应标签位和为输出FLR分配重命名寄存器,这里因为x的源数据在FLR中已经准备好,所以直接将数据放入保留站相应位置,而w指令的源数据来源于R4,此时R4为忙,标签为x的输出对应保留站的ID=1,所以设置相应标签为1,即x指令对应的保留站号。
第二个周期,保留站有空位,仍然发射两条指令到相应位置。同样设置源操作数标签。为FLR4和FLR8设置标签和分配重命名寄存器。由于FLR4标签在前一个周期已经被设置从指向x,即1,需要更新为指向y,即2,即y指令的结果更新FLR4。该周期末,x执行完毕,计算结果通过CDB总线送到w和y指令的相应区域。
第三个周期,w和y开始执行。
第四个周期,y指令执行。
第五个周期,周期末,y执行完毕,数据通过CDB送到z指令,同时更新FLR。
第六个周期,指令x执行完毕,在总线CDB上广播,z和FLR2中相关标签命中,更新相应区域,z开始执行。z指令在低八个周期结束。
ps1:保留站的标签设置是根据FLR标签的值来设置的,在把指令发送到保留站时先设置源操作标签,再设置FLR标签。
ps2:采用这种算法,寄存器R4的内容在出现输出相关时可能漏掉中间数据,例如指令w的结果在R4中不会出现,因此存在不能精确异常定位问题。
相关文章推荐
- iOS开发 -关于使用iOS沙盒路径遇到的问题
- Apriori算法
- spring mvc Cannot locate BeanDefinitionParser for element spring-servlet.xml
- 第五届山东省ACM Full Binary Tree
- zabbix_proxy 代理的实现
- Eclipse 中 CVS show histoy 显示空白
- Java基础-OOP特性之封装、继承、多态、抽象
- HTTP的一些状态消息参考
- JVM调优总结(一)-- 一些概念
- 第五届山东省ACM Factorial
- 毕设系列—服务端:Java-SSH框架(一)
- D. Number of Parallelograms
- 调用 Android系统资源的方法
- ACM-2013 蟠桃记
- 3-28高项作业
- 第五届山东省ACM Devour Magic
- Java 接口和抽象类区别
- 《自己动手写操作系统》小结
- 【c++】第十二周上机实践作业 项目 1-3
- Java之------单机版书店管理系统(设计思想和设计模式系列七)库存模块