您的位置:首页 > 运维架构

OpenRisc-50-or1200的freeze模块分析

2013-09-01 20:19 309 查看

引言

之前,我们分析or1200的控制通路中的sprs模块和except模块,本小节,我们就分析一下or1200控制通路的最后一个模块,就是freeze模块。

1,整体分析

freeze模块,顾名思义,就是根据各个流水阶段的反馈信号,负责产生控制整条流水线各个阶段的暂停信号,如取指阶段的genpc_freeze和if_freeze信号,解码阶段的id_freeze信号,执行阶段的ex_freeze信号,以及写回阶段的wb_freeze信号,共5个暂停信号。
可以这么说,freeze就好像整条流水线的监工,如果发现某一阶段出现问题,就控制那个流水阶段暂停。

2,暂停信号产生规则

freeze模块产生的这5个信号不是相互独立的,是有一定的规则的,那么到底有什么规则呢?关于freeze模块的5个暂停信号的产生过则,or1200_freeze.v中有如下描述:

//
// Pipeline freeze
//
// Rules how to create freeze signals:
// 1. Not overwriting pipeline stages:
// Freeze signals at the beginning of pipeline (such as if_freeze) can be 
// asserted more often than freeze signals at the of pipeline (such as 
// wb_freeze). In other words, wb_freeze must never be asserted when ex_freeze 
// is not. ex_freeze must never be asserted when id_freeze is not etc.
//
// 2. Inserting NOPs in the middle of pipeline only if supported:
// At this time, only ex_freeze (and wb_freeze) can be deassrted when id_freeze
// (and if_freeze) are asserted.
// This way NOP is asserted from stage ID into EX stage.
//

那如何理解呢?
关于第一条:
这一条比较容易理解,就是说流水线的某一个阶段如果想产生暂停信号,那么这个阶段的前一个流水阶段必须先产生。假如要想产生wb_freeze信号,必须先产生ex_freeze信号。
问什么要有这条规则呢?为了便于理解,我们假设一个情景来说明一下。
我记得我小的时候,我们家每年会种几亩地的西瓜,等西瓜成熟的时候,我爸妈会开着农用车,带着我和我的两个弟弟(老四和老五)去地里摘西瓜,为了加快速度,我们各有分工,我爸负责把西瓜从瓜藤上摘下来,并送到我妈手里,我妈负责把西瓜传到我手里,我负责把这个西瓜送到站在车旁边的老四,老四负责把西瓜递给在车上的老五,老五负责将西瓜慢慢的堆放到车上。
上面的情景分别对应流水线的五个阶段,假如我在摘瓜的过程中突然感觉口渴了,想去喝点水,那么我妈必须先暂停下来,要不然,如果我妈把西瓜向我扔来,但我这时我在喝水,那么这个西瓜就肯定会摔碎。所以,我妈必须先停下来,同样道理,我妈要想停下来,我爸必须也停下来。
如果处在最末端的我的老五如果想想停下来,根据这条规则,那么处在最开始的我爸爸也必须停下来,否则的话就会出问题。
还回到流水线,这条规则保证了不会有指令丢失。设想一下,如果流水线的EX阶段暂停了,ID阶段却没暂停下来,就会出现ID阶段解码的指令,EX不会执行的情况。

关于第二条:
如果说第一条是规定暂定信号产生规则的话,那么第二条就是规定暂停信号如何解除了。举个例子,如果EX阶段要想解除暂停信号,那么EX阶段的前面的阶段必须不能解除,否则的话就会违背第一条规则了。

3,代码分析

了解了freeze模块的功能和暂停信号的产生规则之后,那rtl代码具体是如何实现的呢?
首先是取指阶段的暂停信号,代码如下:

assign genpc_freeze = (du_stall & !saving_if_insn) | flushpipe_r;
assign if_freeze = id_freeze | extend_flush;


这里需要说明的是,如果在取指阶段出现问题,比如出现指令总线的应答错误,那么就需要刷新流水线,代码如下:

//
// registered flushpipe
//
always @(posedge clk or `OR1200_RST_EVENT rst)
	if (rst == `OR1200_RST_VALUE)
		flushpipe_r <=  1'b0;
	else if (icpu_ack_i | icpu_err_i)
//	else if (!if_stall)
		flushpipe_r <=  flushpipe;
	else if (!flushpipe)
		flushpipe_r <=  1'b0;


其次是解码,执行和写回阶段的暂停信号,代码如下:

assign id_freeze = (lsu_stall | (~lsu_unstall & if_stall) | multicycle_freeze 
		    | (|waiting_on) | force_dslot_fetch) | du_stall;
assign ex_freeze = wb_freeze;

assign wb_freeze = (lsu_stall | (~lsu_unstall & if_stall) | multicycle_freeze 
		    | (|waiting_on)) | du_stall | abort_ex;

需要说明的是这三个阶段的暂停信号的产生有一个多周期的问题,和流水线等待问题。
or1200的大部分指令都需要一个指令周期,但是有几条指令需要多个指令周期,如果需要这几条指令时,就需要暂停信号,代码如下:

//
// Multicycle freeze
//
assign multicycle_freeze = |multicycle_cnt;

//
// Multicycle counter
//
always @(posedge clk or `OR1200_RST_EVENT rst)
	if (rst == `OR1200_RST_VALUE)
		multicycle_cnt <=  `OR1200_MULTICYCLE_WIDTH'd0;
	else if (|multicycle_cnt)
		multicycle_cnt <=  multicycle_cnt - `OR1200_MULTICYCLE_WIDTH'd1;
	else if (|multicycle & !ex_freeze)
		multicycle_cnt <=  multicycle;

那么都有哪些指令是多周期指令呢?or1200_define.v中相关代码如下:

// Execution control which will "wait on" a module to finish
`define OR1200_WAIT_ON_WIDTH 2
`define OR1200_WAIT_ON_NOTHING    `OR1200_WAIT_ON_WIDTH'd0
`define OR1200_WAIT_ON_MULTMAC    `OR1200_WAIT_ON_WIDTH'd1
`define OR1200_WAIT_ON_FPU        `OR1200_WAIT_ON_WIDTH'd2
`define OR1200_WAIT_ON_MTSPR      `OR1200_WAIT_ON_WIDTH'd3


此外,在遇到一些特殊情况,流水线需要等待(wait_on),这时,也需要暂停流水线,代码如下:

//
// Waiting on generation
//
always @(posedge clk or `OR1200_RST_EVENT rst)
  if (rst == `OR1200_RST_VALUE)
    waiting_on <= 0;
  else if ((waiting_on == `OR1200_WAIT_ON_MULTMAC) & !mac_stall)
    waiting_on <= 0;   
  else if ((waiting_on == `OR1200_WAIT_ON_FPU) & fpu_done)
    waiting_on <= 0;
  else if ((waiting_on == `OR1200_WAIT_ON_MTSPR) & mtspr_done)
    waiting_on <= 0;
  else if (!ex_freeze)
    waiting_on <= wait_on;

关于wait_on信号的产生,我们在分析ID模块(ctrl)时,已经介绍过了,如有疑问请参考:/article/1353086.html

4,小结

freeze模块是整条流水线的大管家,控制着流水线的暂停和执行大权,但其代码却没有想象的那么复杂,越是深奥的道理,一般使用的语言都非常简单,freeze模块也正好证明了这一点。
自此,我们将or1200的数据通路和控制通路都分析了一下,剩下的工作就是其它可选但却不可或缺的debug模块,负责精确定时的tick timer模块,以及负责整个CPU功耗管理的power management模块了。
革命尚未成功,同志仍需努力。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: