GPU架构基础 之 关于CUDA中线程访存的关系
2015-11-16 20:25
429 查看
device端,即GPU:
读写----------- 访问单位 -----存储
R/W per-thread register
R/W per-thread local memory
R/W per-block shared memory
R/W per-grid global memory
Read Only per-grid constant memory
host端,即CPU:
R/W per-grid global and constant memory
register 是每个线程私有的,每个线程只能从寄存器和shared mem 中直接读取数据。
在费米架构中,线程之间通信要靠shared mem,而在 kepler 架构中,shuffle指令可以使
每个warp中的不同线程共享寄存器。
读写----------- 访问单位 -----存储
R/W per-thread register
R/W per-thread local memory
R/W per-block shared memory
R/W per-grid global memory
Read Only per-grid constant memory
host端,即CPU:
R/W per-grid global and constant memory
register 是每个线程私有的,每个线程只能从寄存器和shared mem 中直接读取数据。
在费米架构中,线程之间通信要靠shared mem,而在 kepler 架构中,shuffle指令可以使
每个warp中的不同线程共享寄存器。
相关文章推荐
- 用python做GPU计算(1)——安装以及配置
- GPU(CUDA)学习日记(三)------ CUDA基本架构介绍以及编程入门!
- vs2008--CUDA环境配置
- window 下 pycuda 安装运行
- CUDA技术帖: 3D texture linear data VS 3D cudaArray
- 一个你可能不知道的cuda细节
- NVIDIA CUDA统一计算设备架构编程手册(1)
- CUDA中文教程01之心得体会
- CUDA中文教程03之心得体会
- 【GPU开发笔记】二:CUDA初探——查询设备
- cuda一些小问题(不断更新)
- 一种简单的GPU三维图像分割算法
- Linux系统下CUDA中的原子操作
- CUDA --1 基础知识
- ubuntu 12.04 13.10 安装 cuda 5.5
- 在WinDOWS X64下 Cuda NVCC 与 Intel C/C++ compiler联合使用的问题
- 联想(Lenovo) IdeaPad Y550A-TSI 15.6英寸笔记本电脑
- opencv中GPU的流操作
- 让vs2005支持NVDIA CUDA的cu文件语法高亮显示
- CUDA vc2005环境配置方法总结