OpenBLAS 0.3.6 发布,优化GEMM和CPU提高AMD Zen性能
2019-04-30 00:00
1211 查看
OpenBLAS的新版本现已推出,这是广泛使用的开源BLAS实现,用于优化线性代数内核。 使用OpenBLAS 0.3.6,可以继续为各种CPU体系结构最大化BLAS性能。
OpenBLAS 0.3.6随附CMake构建系统改进,各种POWER优化,对HiSilicon TSV110处理器的支持,由于未解决的问题再次禁用AVX-512 DGEMM内核,英特尔Denverton CPU的自动检测,自动检测 Hygon Dhyana Zen CPU,以及AMD Zen处理器上改进的GEMM性能。
OpenBLAS 0.3.6还带有各种修复,IBM z13/z14优化以及对此线性代数库的其他改进。
有关OpenBLAS 0.3.6更改的更多详细信息请参阅通过GitHub存储库。
相关文章推荐
- Intel软件大会——提高多核cpu windows应用程序性能,高性能计算优化(待改)
- 提高jQuery性能优化的技巧
- Unity性能优化之CPU篇
- 优化Linux下的内核TCP参数以提高系统性能
- 优化 SQL Server CPU 性能
- MySQL性能优化之Open_Table配置参数的合理配置建议
- 杜绝Cookie传送提高网站访问速度(性能优化)
- Caffe:CPU模式下使用openblas-openmp(多线程版本)
- 网站优化 提高网站性能
- kvm性能优化方案---cpu/内存/磁盘/网络
- 优化 SQL Server CPU 性能
- Flex 性能优化之cpu占用率
- 雅虎十四条 - 14个优化网站性能提高网站访问速度的技巧
- Python GIL 系列之通过设置进程运行的CPU来提高Python程序的性能
- 《CSAPP》优化程序性能:性能提高技术
- 性能优化之cpu的 us和sy
- SQL Server-聚焦存储过程性能优化、数据压缩和页压缩提高IO性能(一)
- 优化设计提高sql类数据库的性能
- 如何优化JAVA程序开发,提高JAVA性能