基于纹理内存的CUDA热传导模拟
2014-09-24 16:27
274 查看
原文链接
项目中有三个,第一个是全局内存,其余两个分别是基于1d和2d纹理内存。项目打包下载。
纹理内存是只读内存,与常量内存相同的是,纹理内存也缓存在芯片中,因此某些情况下,它能减少对内存的请求并提供更高效的内存宽带。纹理内存专门为那些内存访问模式中存在大量空间局部性的图形应用程序而设计的。在某个计算应用程序中,这意味着一个线程读取的位置可能与邻近线程读取的位置“非常接近”。纹理缓存为了加速访问不连续的地址而设计的。
温度计算的内存访问模式中存在着巨大的内存空间局部性,这种访问模式可以用GPU纹理内存加速。首先声明纹理内存 texture<float> tex;这个缓存区域分配内存后需要绑定到内存缓冲区。然后,启动核函数时,要用特殊的函数告诉GPU将读取请求转发到纹理内存而不是标准全局内存。当读取内存时不再使用方括号冲缓冲区中读取,而是将blend_kernel()改为tex1Dfetch()。blend_kernel()中又一个参数dstOut告诉那个缓冲区作为输入,哪个作为输出。
项目中有三个,第一个是全局内存,其余两个分别是基于1d和2d纹理内存。项目打包下载。
纹理内存是只读内存,与常量内存相同的是,纹理内存也缓存在芯片中,因此某些情况下,它能减少对内存的请求并提供更高效的内存宽带。纹理内存专门为那些内存访问模式中存在大量空间局部性的图形应用程序而设计的。在某个计算应用程序中,这意味着一个线程读取的位置可能与邻近线程读取的位置“非常接近”。纹理缓存为了加速访问不连续的地址而设计的。
温度计算的内存访问模式中存在着巨大的内存空间局部性,这种访问模式可以用GPU纹理内存加速。首先声明纹理内存 texture<float> tex;这个缓存区域分配内存后需要绑定到内存缓冲区。然后,启动核函数时,要用特殊的函数告诉GPU将读取请求转发到纹理内存而不是标准全局内存。当读取内存时不再使用方括号冲缓冲区中读取,而是将blend_kernel()改为tex1Dfetch()。blend_kernel()中又一个参数dstOut告诉那个缓冲区作为输入,哪个作为输出。
相关文章推荐
- CUDA 纹理内存
- CUDA纹理内存的使用
- cuda共享内存,全局内存,纹理等的解释
- 【CUDA学习笔记】1.纹理内存
- CUDA 学习(十四)、纹理内存
- 使用二维纹理内存模拟热传导
- CUDA二维纹理内存+OpenCV图像滤波
- cuda纹理内存简单操作 (2015年)
- CUDA 图像处理使用纹理内存与不使用纹理内存对比
- CUDA纹理内存相关参数解释
- CUDA 纹理内存
- 绑定CUDA三维数组与纹理内存
- [菜鸟每天来段CUDA_C]CUDA实现简单热传导动态模拟
- CUDA 纹理内存
- CUDA中多维数组以及多维纹理内存的使用
- CUDA使用纹理内存
- [菜鸟每天来段CUDA_C]基于共享内存的位图与syncthreads的使用
- CUDA学习日志:常量内存和纹理内存
- cuda纹理内存使用
- CUDA总结:纹理内存