- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用 fortran BLAS gemm
函数进行矩阵乘法,请参阅 here .
这个函数的签名是,所有参数的含义都可以在上面的链接中找到。
call sgemm(transa, transb, m, n, k, alpha, a, lda, b, ldb, beta, c, ldc)
我的问题是,我想使用 C 连续数组而不是 Fortran 连续数组,我已经使用上面的 sgemm
很长一段时间了,但仍然很困惑。
请帮我看一些具体的例子。
我所有的输入数组都是 C 连续的。
a = [[0,1],
[2,3]]
b = [[0,1,2],
[3,4,5]]
# pre-alloc memory for c
c = [[0,0,0],
[0,0,0]]
# compute c = a * b, which should be as follows
# c = [[3,4,5],
# [9,14,19]]
# since sgemm assumes Fortran-contiguous, so I thought it would be
sgemm('T', 'T', 2, 3, 2, 1.0, a, 2, b, 3, 0, c, 2)
~~~~~~~ ~~~~~~~ ~~~ ~~~ ~~~
trans both m,n,k lda ldb ldc
# HOWEVER, c is not what I expected,
c = [[3,9,4],
[14,5,19]]
显然 sgemm 以 Fortran 连续顺序存储元素,如何解决这个问题?另外我不太明白那些 m,n,k,lda,ldb
是如何确定 transa/transb='T' 或 'N'
的,希望你可以给我一个详细的解释。
注意
我正在使用从 scipy.linalg.cython_blas 导出的 gemm
函数,这意味着,除了玩这个 Fortran 排序的东西,我别无选择。
最佳答案
如果您想使用行优先矩阵而不是 Fortran 风格的列优先矩阵,您可以使用 CBLAS API gemm。您可以使用第一个参数选择矩阵存储布局。
https://software.intel.com/en-us/node/520775
或者您仍然可以使用 Fortran API。因为改变矩阵布局等同于矩阵转置。但是,您正在以错误的方式计算转置 C。
您的代码计算列优先的 C,但您需要行优先的 C。所以需要通过Fortran API计算C^T in col-major,相当于C in row-major。
应该是
C^T = B^T * A^T
基本上你需要交换A和B,以及相应的参数。有关这些参数的更多详细信息,您可以查看此答案。
关于python - C 连续矩阵上的 Fortran gemm 函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38157215/
是的,我知道..,这不是想象的...这是一个真正的 Fortran 问题。 以前的版本是指 Fortran 2003、95、90,甚至 77。 我所说的“向后兼容”是指可以轻松运行为 2008 年以前
我有一个程序,它的变量中有一个值。一旦确定了该值,我想调用另一个程序并使用该变量的值来确定在新程序中的位置。有人知道该怎么做吗? 最佳答案 如果您有 Fortran 2008 编译器,您将拥有标准子例
namelist 是一种有用的 fortran 结构,可以从文件中快速初始化变量。 namelist 有一个名称并包含一组具有已知类型的变量。这使得它类似于 type 结构。 通常情况下,给程序或子例
我正在遍历索引,我正在检查我是否不在第一个循环交互和另一个条件中。如果第一个条件是 .False.,我不想评估第二个条件。 do i = 1, n if ( i /= 1 .and. var(
Fortran 2003 具有用于数组连接的方括号语法,Intel fortran 编译器也支持它。我在这里为矩阵连接写了一个简单的代码: program matrix implicit none r
我正在尝试通过重载类型名称来制作自定义数据类型构造函数。但是,在进行调用时,将调用默认构造函数。我不明白我做错了什么。 这是有问题的代码片段。 module test type, pu
我的最终目标是在 Fortran 中有一个通用的映射函数,即一个接受任意类型 A 的数组和一个 A->B 类型的函数的函数,将此函数应用于给定数组的所有元素并返回一个B 类型的数组。我无法用数组实现它
我正在学习 Fortran,在使用格式编写时发现了一些奇怪的东西(我使用的是 Fortran onlinegdb) Program Hello real, dimension(3,2):: array
Fortran 中的INTERFACE 语句是否使其成为正式实现multiple dispatch 的编程语言? ? (我问是因为所链接的维基百科文章在其看似全面的支持相关范式的示例编程语言列表中并未
我可以使用 Fortran 95 编译器编译 Fortran 90 文件吗? Fortran 95 似乎有很多,但 Fortran 90 没有。 最佳答案 这个可以: NAGWare f95 Comp
嗨,我在 Fortran 中对二维离散化问题强加边界条件时遇到了麻烦。我的离散化网格是一个二维正方形,在 x,y 方向上从 -L 到 L。 我想强加这样的边界条件, 在 x=L 的边界线上,指定了函数
Fortran 是否有与 C assert 等效的标准函数/关键字? ? 我找不到 assert我在Fortran2003标准中提到过。我发现了一些如何使用预处理器的方法,但是在这个 answer建议
我有一系列的作业,使用“;”将它们分配给同一个ike。分开statemnts,但我收到此错误: 1.0;磅(1,9) 1个 错误:(1)处无法分类的陈述 在文件LJ.F90:223中 如果每个语句都在
我正在使用 gfortran -std=f2008。我有一个函数,它返回一个包含可分配数组的派生类型。该函数在返回之前调用allocate()。似乎在分配数组的函数返回之后,数组会自动释放一段时间,并
我制作了这个小型测试程序来“证明”在编译之前(或者如果你让它们可分配),你不能在不指定它们的大小的情况下使用向量。我的观点失败了。我期待本地向量“num”会失败。程序在执行程序之前无法知道它的大小。大
出于优化原因,Fortran 强制子例程或函数的虚拟参数不是别名,即它们不指向相同的内存位置。 我想知道相同的约束是否适用于函数的返回值。 换句话说,对于给定的 myfunc 函数: function
我已经在Fortran 90中编写了一个相当大的程序。它已经运行了一段时间了,但是今天我尝试将其提高一个档次并增加问题的大小(这是研究非标准的有限元求解器,如果那样的话)。可以帮助任何人...)现在,
在 C 和 C++ 中,有许多操作会导致未定义的行为,即允许编译器做任何它想做的事情的情况。 Examples包括在释放变量后使用它,释放变量两次和取消引用空指针。 Fortran 是否也有未定义的行
通常我使用fortran进行数值分析,然后使用matlab、R和python进行后期和前期工作。 我发现 matlab、R 和 python 在终端中提供了命令提示符,以便您可以运行脚本以及从命令行立
在 Fortran 中将变量设置为 +Infinity 的最安全方法是什么?目前我正在使用: program test implicit none print *,infinity() con
我是一名优秀的程序员,十分优秀!