- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用 CUSPARSE 函数来执行稀疏矩阵向量/矩阵矩阵乘法。
稀疏矩阵以 CSR 格式存储。在 Visual Profiler 下分析应用程序时,我注意到对于 cusparse(S/D)csrmv 或 cusparse(S/D)csrmm 的每次调用都有一个内存分配/memset/copy。
通过查看分析器中的内核名称,看起来 CUSPARSE 在每次调用时将矩阵从 CSR 格式转换为 HYB 格式,这在我的情况下是浪费时间,因为我可以在启动计算之前以正确的格式创建矩阵。
虽然 CUSPARSE 有矩阵向量乘法 (hybmv) 的 HYB 版本,但它没有矩阵矩阵乘法的对应版本,看起来只支持 CSR 格式。
在 CUSPARSE 中进行矩阵-矩阵 muls 时是否可以避免矩阵转换?
最佳答案
我问了周围。我收到的答案是 cusparse 在执行 csrmv
时不会从 CSR 转换为 HYB 格式。操作。您所看到的 hyb 可能是内部内核名称的重整形式,如下所示:
_Z14csrMm_hyb_coreIdLi7ELi6ELi2ELi1ELb0EEv19cusparseCsrMmParamsIT_Ei
关于cuda - csrmv/csrmm 中的 CUSPARSE 内部格式转换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17817047/
我只是想知道 Nvidia 或任何其他使用 csrmm 的可信来源是否提供了任何示例。来自 cusparse 的函数库,将稀疏矩阵与稠密矩阵相乘。 先感谢您 最佳答案 引用the documentat
我正在使用 CUSPARSE 函数来执行稀疏矩阵向量/矩阵矩阵乘法。 稀疏矩阵以 CSR 格式存储。在 Visual Profiler 下分析应用程序时,我注意到对于 cusparse(S/D)csr
我是一名优秀的程序员,十分优秀!