CUDA优化知识点
2017-10-18 17:39
225 查看
CUDA编程分为Host端与Device端
1,host端
2,device端
存储:
1,内存对齐,连续
2,存放数据选择合适的存储类型(寄存器,共享内存,常量内存,局部内存,纹理内存)
3,注意bank conflict
计算:
1,注意分支歧义
2,尽量使用cublas
准确性:
1,数据类型精度(float与double在某些运算中是不准确的)
2,原子操作
3,同步
带宽:
1,零拷贝
2,内存锁页
3,NVLink
性能测试:
1,nvprof
2,时间测试
Debug:
1,cuda-gdb
1,host端
2,device端
存储:
1,内存对齐,连续
2,存放数据选择合适的存储类型(寄存器,共享内存,常量内存,局部内存,纹理内存)
3,注意bank conflict
计算:
1,注意分支歧义
2,尽量使用cublas
准确性:
1,数据类型精度(float与double在某些运算中是不准确的)
2,原子操作
3,同步
带宽:
1,零拷贝
2,内存锁页
3,NVLink
性能测试:
1,nvprof
2,时间测试
Debug:
1,cuda-gdb
相关文章推荐
- 基于CUDA的GPU优化建议
- CUDA编程—通过shared memory优化矩阵相乘
- CUDA程序优化
- 双边滤波CUDA优化——BilateralFilter CUDA
- 前端性能优化小知识点(javascript)
- 凸优化知识点总结
- 老男孩视频学习知识点总结之系统优化初步讲解
- VS项目编译包含CUDA的静态库及在原项目中添加CUDA优化代码方法
- CUDA知识点
- CUDA学习笔记之程序优化
- CUDA程序优化心得之测时函数的设计
- CUDA优化实例(三)共享内存
- 由单例模式的优化,引出的java线程数据同步和类加载顺序知识点总结
- CUDA优化实例(五)纹理内存与常量内存
- CUDA(12)之我的一个新的并行优化定理
- CUDA 学习优化思路
- Cuda 学习教程(四):Cuda程序的优化
- CUDA程序优化策略
- cuda编程优化1
- CUDA优化