您的位置：首页 > 运维架构 > 网站架构

GPU架构基础之关于CUDA中线程访存的关系

2015-11-16 20:25 429 查看

device端，即GPU:

读写----------- 访问单位 -----存储

R/W   per-thread   register

R/W    per-thread local memory

R/W per-block shared memory

R/W    per-grid   global memory

Read Only per-grid constant memory

host端，即CPU：

R/W   per-grid global and constant memory

register 是每个线程私有的，每个线程只能从寄存器和shared mem 中直接读取数据。

在费米架构中，线程之间通信要靠shared mem，而在 kepler 架构中，shuffle指令可以使

每个warp中的不同线程共享寄存器。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： cuda

相关文章推荐

用python做GPU计算（1）——安装以及配置
GPU(CUDA)学习日记（三）------ CUDA基本架构介绍以及编程入门！
vs2008--CUDA环境配置
window 下 pycuda 安装运行
CUDA技术帖： 3D texture linear data VS 3D cudaArray
一个你可能不知道的cuda细节
NVIDIA CUDA统一计算设备架构编程手册(1)
CUDA中文教程01之心得体会
CUDA中文教程03之心得体会
【GPU开发笔记】二：CUDA初探——查询设备
cuda一些小问题(不断更新）
一种简单的GPU三维图像分割算法
Linux系统下CUDA中的原子操作
CUDA --1 基础知识
ubuntu 12.04 13.10 安装 cuda 5.5
在WinDOWS X64下 Cuda NVCC 与 Intel C/C++ compiler联合使用的问题
联想（Lenovo) IdeaPad Y550A-TSI 15.6英寸笔记本电脑
opencv中GPU的流操作
让vs2005支持NVDIA CUDA的cu文件语法高亮显示
CUDA vc2005环境配置方法总结

新的分享

嵌入式软件开发之程序架构设计-任务调度
嵌入式软件架构设计-程序分层
嵌入式软件架构设计-模块化
阿里大牛是怎么变Bug为宝的？ - 架构
分布式架构下的通信(一)
深度学习与CV教程(9) | 典型CNN架构 (Alexnet,VGG,Googlenet,Resnet等)
Prometheus架构以及原理详细介绍
深度解析数字金融业务发展与配套技术基础建设 - 架构
传统数仓不够用？看广东华兴银行混合型数仓实践思路 - 架构
Gartner对于建设数据中台的建议 - 架构
一文带你搞懂 Kafka 的系统架构（深度好文，值得收藏）
GitHub国内镜像网站

章节导航

GPU架构基础 之 关于CUDA中线程访存的关系

GPU架构基础之关于CUDA中线程访存的关系