gpt4 book ai didi

c++ - 我可以在 cblas_dgemm(...) 中传递与 "C"和 "A"矩阵相同的矩阵指针吗?

转载 作者:行者123 更新时间:2023-11-28 08:05:53 25 4
gpt4 key购买 nike

我想用值 C*B 更新 C。我还想用值 C*C 更新 C。

这样做安全吗?我不想给我的学生糟糕的代码。我目前正在将 cblas_gemm(...) 的临时结果复制回 C 矩阵...这很慢。

最佳答案

如果使用相同的矩阵作为输入和输出是安全的,则 BLAS 实现将需要使用临时工作区。由于您没有提供这样的工作区,因为函数没有要求,我们可以得出结论,您不能使用相同的矩阵作为输入和输出。

事实上,如果 BLAS 例程要接受一个参数作为输入和输出,那么它将通过使用一个参数而不是两个参数来实现,并记录该参数用于输入和输出。

你说使用临时输出变量然后在 BLAS 调用后复制很慢。但是与矩阵乘法相比,该复制操作应该是微不足道的。您确定拷贝是瓶颈吗?你计时了吗?

关于c++ - 我可以在 cblas_dgemm(...) 中传递与 "C"和 "A"矩阵相同的矩阵指针吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10291933/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com