您的位置：首页 > 其它

体系结构学习10-DLP

2020-05-11 04:13 183 查看

DLP类型

SISD、SIMD、MISD（TPU：脉动网络）、MIMD

在执行时数据之间没有数据冒险，没有转发需求。

解决内存瓶颈：

加快指令执行：

解决数据超过VLR：

存在无法矢量处理的标量时，需要像CRAY-1一样让标量处理很快。

SIMD
Intel的多媒体扩展：64 bit -> 2*32 bit 相当于把一个寄存器拆成一个矢量寄存器。但是没有VLR，长度固定，操作单一stride总为1
Intel AVX：256-bit register
Intel的库：mkl（software.intel.com）

2006：Nvidia的CUDA -GPU编程语言，利用多线程。（还有OpenCL）

相当于一块协处理器。

当今GPU架构——2017Volta /2018Turing

编程模式：SPMD 单程序多数据
执行模式：视为SIMD机器，多线程合并同时执行。SIMT（单个指令多个线程——一个warp包含多个线程）

Volta（2017）结构
GPU-GPU直连，GDDR5显存带宽更大

原创文章 19获赞 1访问量 686 关注私信

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航