作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
看看那里的 OpenCL 库,我试图完全掌握每个库。特别是一个图书馆是 clBLAS .他们的网站声明它实现了 BLAS 级别 1、2 和 3 方法。那很好,但是 ViennaCL也有 BLAS 例程、线性代数求解器、支持 OpenCL 和 CUDA 后端,并且只有头文件。目前在我看来,似乎没有理由在 ViennaCL 上使用 clBLAS,但我想知道 如果有人有任何理由为什么要使用 clBLAS 而不是 ViennaCL ?
虽然相似,但这意味着是 this previous question 的扩展比较 VexCL、Thrust 和 Boost.Compute。
最佳答案
clBlas 是由 AMD 实现的,因此人们可以希望它在 AMD 硬件上会更快。这通常是供应商 BLAS 实现的唯一优势。不幸的是,这里似乎并非如此。
在 this talk ViennaCL 作者报告说,由于他们的自动调整框架,他们能够胜过 clBLAS,或者表现出类似的性能。
关于opencl - clBLAS 和 ViennaCL 之间的区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30459112/
看看那里的 OpenCL 库,我试图完全掌握每个库。特别是一个图书馆是 clBLAS .他们的网站声明它实现了 BLAS 级别 1、2 和 3 方法。那很好,但是 ViennaCL也有 BLAS 例程
我正在尝试为 OSX 10.9 上的 python 安装 libgpuarray ( http://deeplearning.net/software/libgpuarray/installation
我是一名优秀的程序员,十分优秀!