GPU中与CUDA相关的几个概念
2015-12-14 22:06
417 查看
GPU中与CUDA相关的几个概念
标签:cudathread任务编程存储
2012-06-04 12:42
2998人阅读 评论(0)
收藏
举报
![](https://oscdn.geek-share.com/Uploads/Images/Content/201611/b367fdce88ee208da19a58e7fab01f44.jpg)
分类:
GPU(284)
![](https://oscdn.geek-share.com/Uploads/Images/Content/201611/b16356edc9d65f9de5798055c2b20c3c.jpg)
计算机系统(78)
![](https://oscdn.geek-share.com/Uploads/Images/Content/201611/b16356edc9d65f9de5798055c2b20c3c.jpg)
硬件相关(189)
![](https://oscdn.geek-share.com/Uploads/Images/Content/201611/b16356edc9d65f9de5798055c2b20c3c.jpg)
其它文章(1331)
![](https://oscdn.geek-share.com/Uploads/Images/Content/201611/b16356edc9d65f9de5798055c2b20c3c.jpg)
今天说说GPU的硬件结构中与CUDA相关的几个概念:thread block grid warp sp sm
sp: 最基本的处理单元,streaming processor 最后具体的指令和任务都是在sp上处理的。GPU进行并行计算,也就是很多个sp同时做处理
sm:多个sp加上其他的一些资源组成一个sm, streaming multiprocessor. 其他资源也就是存储资源,共享内存,寄储器等。
warp:GPU执行程序时的调度单位,目前cuda的warp的大小为32,同在一个warp的线程,以不同数据资源执行相同的指令。
thread-->block-->grid:在利用cuda进行编程时,一个grid分为多个block,而一个block分为多个thread。其中任务划分到是否影响最后的执行效果。划分的依据是任务特性和GPU本身的硬件特性。
下面几张硬件结构简图 便于理解(图片来源于网上)
![](http://my.csdn.net/uploads/201206/04/1338785147_6846.jpg)
![](http://my.csdn.net/uploads/201206/04/1338785152_6320.jpg)
以上两图可以清晰地表示出sm与sp的关系。
![](http://my.csdn.net/uploads/201206/04/1338785156_7399.jpg)
此图反应了warp作为调度单位的作用,每次GPU调度一个warp里的32个线程执行同一条指令,其中各
个线程对应的数据资源不同。
![](http://my.csdn.net/uploads/201206/04/1338785159_8791.jpg)
此图是一个warp排程的例子。
一个sm只会执行一个block里的warp,当该block里warp执行完才会执行其他block里的warp。
进行划分时,最好保证每个block里的warp比较合理,那样可以一个sm可以交替执行里面的warp,从而提高
效率,此外,在分配block时,要根据GPU的sm个数,分配出合理的block数,让GPU的sm都利用起来,提
利用率。分配时,也要考虑到同一个线程block的资源问题,不要出现对应的资源不够。
相关文章推荐
- iOS开发之FMDB
- Kurento应用开发指南(以Kurento 5.0为模板) 之五:kurento架构
- FastCGI简介
- 使用View Animation实现动画加载界面
- iOS RAC下的MVVM
- 广播接收器
- 《一个操作系统的实现》学习笔记(一) bochs源码安装及配置
- prompt()、 isNaN()函数简介
- Android:Fragment 初步之旅 随记一
- Kurento应用开发指南(以Kurento 5.0为模板) 之四:示例教程 一对一视频呼叫
- 关于dip、dpi和分辨率的一些事
- gtest的安装和使用
- 界面布局动态调整
- Android学习笔记——SwipeRefreshLayout 官方下拉刷新控件介绍
- iOS 观察者模式
- Kurento应用开发指南(以Kurento 5.0为模板) 之三:示例教程 一对多的视频呼叫
- 八大排序算法(图文)
- 学生成绩管理系统
- sizeof 运算符
- iOS_开发中遇到的那些问题_5