GPGPU-Sim学习(代码解读)-如何实现Bypass L1D cache
2015-12-05 11:28
288 查看
来填坑了
最近几年,国际上很多研究者开始关注GPGPU缓存调度的研究,其中bypass L1D cache便是其中的一个关注点,比如GPU上的CBWT(A类)算法,Doupled L1D(B类)算法和MRPB(A类),CPU上的PDP(A类)等。这篇博客的内容为如何在GPGPU-Sim上实现bypass L1D cache的缓存请求。
GPGPU-Sim版本:v3.2.2
关注文件:shader.cc
在shader.cc文件中,有两处关于bypass,分别是
1375行的bool ldst_unit::memory_cycle()函数
1795行的void ldst_unit::cycle()函数
在memory_cycle()函数内,即1388行之后
回答评论里的问题:
1、請問1388行之後用來判斷是否bypass的程式碼是什麼意思阿~
答:举个例子,我想让ID=0核心的所有缓存指令全都bypass,那么实现代码如下:
2、另外請問memory_cycle()以及cycle()的差別
答:memory_cycle()为执行阶段的bypass,cycle()为写回阶段的bypass。
这就解释了bypass为何要
因为这样只能保证执行阶段将该指令bypass了,但在写回时仍将数据写回到了缓存中,会造成冲突。
最近几年,国际上很多研究者开始关注GPGPU缓存调度的研究,其中bypass L1D cache便是其中的一个关注点,比如GPU上的CBWT(A类)算法,Doupled L1D(B类)算法和MRPB(A类),CPU上的PDP(A类)等。这篇博客的内容为如何在GPGPU-Sim上实现bypass L1D cache的缓存请求。
GPGPU-Sim版本:v3.2.2
关注文件:shader.cc
在shader.cc文件中,有两处关于bypass,分别是
1375行的bool ldst_unit::memory_cycle()函数
1795行的void ldst_unit::cycle()函数
在memory_cycle()函数内,即1388行之后
bool bypassL1D = false;添加我们想要的代码,修改bypassL1D的值,即可实现bypass L1D cache缓存请求。
回答评论里的问题:
1、請問1388行之後用來判斷是否bypass的程式碼是什麼意思阿~
答:举个例子,我想让ID=0核心的所有缓存指令全都bypass,那么实现代码如下:
bool bypassL1D = false; if(m_core->get_sid() == 0) inst.cache_op = CACHE_GLOBAL;
2、另外請問memory_cycle()以及cycle()的差別
答:memory_cycle()为执行阶段的bypass,cycle()为写回阶段的bypass。
这就解释了bypass为何要
inst.cache_op = CACHE_GLOBAL;这样实现。下面的实现是错误的,
bool bypassL1D = false; if(m_core->get_sid() == 0) bypassL1D = true;
因为这样只能保证执行阶段将该指令bypass了,但在写回时仍将数据写回到了缓存中,会造成冲突。
相关文章推荐
- java 杂物间 (一) Mybatis
- python--字典排序
- windows下,在python中安装xgboost的简易方法,解决 error C3861: “sleep”: 找不到标识符”
- 用myeclipse来创建第一个web程序
- 学习C语言总结
- C++ 读取文件中的数字 并存放到vector中 在由vector存放到 multimap中 最后BFS 判断是否连通
- eclipse 显示 Problems view
- 在PHP中应用AJAX技术实现博客文章类别添加
- JAVA与.NET的相互调用——通过Web服务实现相互调用
- JDK 8 和myeclipse
- C/C++程序基础
- Python基本 list
- ASP.NET MVC – 关于Action返回结果类型的事儿(上)
- ASP.NET MVC – 关于Action返回结果类型的事儿(上)
- JAVA通信编程(二)——如何读取java的properties配置文件(插播)
- JAVA通信编程(二)——如何读取java的properties配置文件(插播)
- Python 列表(Lists)
- Python 字符串
- Java通过C++调用 C# DLL
- Python 数字