《CUDA高性能并行计算》阅读摘要
2017-12-24 14:14
176 查看
这本书从实例出发,并详细介绍了开发环境的配置,容易上手,挺适合初学者看的。
ch1
CUDA运行环境以及两个串行运算例程distV1和distV2
ch2
CUDA并行编程模式介绍
ch3
一维数组并行化方法
ch4
二维线程网格的定义与编程,距离计算例程dist_2D
采用OpenGL框架进行交互的应用:
flashlight:根据参考点的距离分配RGB数值
stablity:求解一阶常微分方程并可视化显示
ch5
模板与共享内存
共享内存用于同一线程块下不同线程的数据交互,同一线程块内48KB
有限差分法在一维网格中计算导数
有限差分法求解二维拉不拉斯方程
heat_2D:计算温度稳态分布并通过图像交互显示的应用
sharpen:共享内存实现图像锐化
ch6
归约与原子操作,考虑所有线程间的相互关系
parallel_dot:并行化的点乘操作
centroid_2d: 并行化计算图形质心
ch7
三维数据交互
(不是很感兴趣没怎么看)
ch8
cuda中现有的库
Trust库:基本模板库
cuRAND库:随机数产生
NPP库:高性能原语库
cuSOLVER和cuBLAS:线性代数库
cuDNN库:深度学习库
ArrayFire库:高性能并行计算库
-
ch1
CUDA运行环境以及两个串行运算例程distV1和distV2
ch2
CUDA并行编程模式介绍
ch3
一维数组并行化方法
__device__关键字:函数仅在设备上调用和执行 __global__关键字:函数在host端调用,在设备上执行 __host__关键字:默认,在host调用和执行
ch4
二维线程网格的定义与编程,距离计算例程dist_2D
采用OpenGL框架进行交互的应用:
flashlight:根据参考点的距离分配RGB数值
stablity:求解一阶常微分方程并可视化显示
ch5
模板与共享内存
共享内存用于同一线程块下不同线程的数据交互,同一线程块内48KB
有限差分法在一维网格中计算导数
有限差分法求解二维拉不拉斯方程
heat_2D:计算温度稳态分布并通过图像交互显示的应用
sharpen:共享内存实现图像锐化
ch6
归约与原子操作,考虑所有线程间的相互关系
parallel_dot:并行化的点乘操作
centroid_2d: 并行化计算图形质心
ch7
三维数据交互
(不是很感兴趣没怎么看)
ch8
cuda中现有的库
Trust库:基本模板库
cuRAND库:随机数产生
NPP库:高性能原语库
cuSOLVER和cuBLAS:线性代数库
cuDNN库:深度学习库
ArrayFire库:高性能并行计算库
-
相关文章推荐
- Mastering Delphi7 阅读笔记(摘要) 续
- 《21世纪资本论》阅读摘要2
- Django 快速搭建博客 第十一节(文章阅读量统计,自动生成文章摘要)
- 《R语言与数据挖掘最佳实践和经典案例》阅读摘要
- mysql++ 官方文档阅读简略摘要
- 摘要: 《云栖精选》将以月刊的形式推出,集结社区前瞻趋势类、应用实践类、在线峰会内容整理及回顾等精华文章,定期刊出,欢迎大家阅读下载。本期《云栖精选-2017年6月刊》以人工智能为封面选题,特综合性选
- 阅读MongoDB摘要 - Querying
- 【Python】Python编程规范(PEP8)阅读摘要
- GFx 阅读摘要
- Teaching Machines to Converse--阅读笔记1 摘要及介绍
- CLR Via C# 3rd 阅读摘要 -- Chapter 21 – Automatic Memory Management (Garbage Collection)
- 博客系统开发推送第一季----编写发表博客,并生成阅读摘要
- Docker迈入云(DockerHub)+端(Docker引擎)时代 发表于14小时前| 1120次阅读| 来源OpenStack中国社区| 3 条评论| 作者郭长波 DockerPaaSGCE 摘要
- Python编程规范(PEP8)阅读摘要
- CVPR 2016 摘要阅读
- 阅读干货—HTTP记录与内容摘要
- AMS2100文档阅读摘要
- CLR Via C# 3rd 阅读摘要 -- Chapter 24 – Runtime Serialization
- 阅读《LEARNING HARD C#学习笔记》知识点总结与摘要二
- c++11 --- override and final 的阅读笔记摘要