gpt4 book ai didi

fortran - BLAS 函数在 Fortran90 中返回零

转载 作者:行者123 更新时间:2023-12-01 01:45:16 36 4
gpt4 key购买 nike

我正在学习在 Fortran90 中使用 BLAS,并使用子程序 SAXPY 编写了一个简单的程序和函数 SNRM2 .该程序通过从另一个向量中减去一个向量,然后取结果的欧几里德范数来计算两点之间的距离。

我将 SNRM2 的返回值指定为 external根据对类似问题的回答,"Calling BLAS functions" .
我的完整程序:

program test
implicit none

real :: dist
real, dimension(3) :: a, b
real, external :: SNRM2

a = (/ 3.0, 0.0, 0.0 /)
b = (/ 0.0, 4.0, 0.0 /)

call SAXPY(3, -1.0, a,1, b,1)
print *, 'difference vector: ', b

dist = 6.66 !to show that SNRM2 is doing something
dist = SNRM2(3, b, 1)
print *, 'length of diff vector: ', dist

end program test

程序的结果是:
difference vector:   -3.00000000       4.00000000       0.00000000    
length of diff vector: 0.00000000

差分向量是正确的,但长度应该是 5。那么为什么 SNRM2 返回零值呢?

我知道变量 dist由 SNRM2 修改,所以我不怀疑我的 openBLAS 安装坏了。我正在运行 macos10.13 并使用自制软件安装了所有内容。

我正在使用启用了许多标志的 gfortran 进行编译,但没有收到任何警告:
gfortran test.f90 -lblas -g -fimplicit-none -fcheck=all -fwhole-file -fcheck=all -fbacktrace -Wall -Wextra -Wline-truncation -Wcharacter-truncation -Wsurprising -Waliasing -Wconversion -Wno-unused-parameter -pedantic -o test

我试着看 the code for snrm2.f ,但我没有看到任何潜在的问题。

我也尝试用 real(4) 声明我的变量或 real(selected_real_kind(6))行为没有改变。

谢谢!

最佳答案

根据这个page ,Apple 的 Accelerate Framework 附带的 BLAS 中的单精度例程似乎存在一些问题。
在我的 Mac (OSX10.11) 上,gfortran-8.1(通过 Homebrew 安装)+默认 BLAS(在系统中)给出了错误的结果:

$ gfortran-8 test.f90 -lblas
or
$ gfortran-8 test.f90 -L/System/Library/Frameworks/Accelerate.framework/Frameworks/vecLib.framework/Versions/Current/ -lBLAS
$ ./a.out
difference vector: -3.00000000 4.00000000 0.00000000
length of diff vector: 0.00000000

与 OpenBLAS(通过 Homebrew 安装)显式链接时会给出正确的结果:
$ gfortran-8 test.f90 -L/usr/local/Cellar/openblas/0.2.20_2/lib -lblas
$ ./a.out
difference vector: -3.00000000 4.00000000 0.00000000
length of diff vector: 5.00000000

上面的页面提示问题出现在以不符合旧g77样式的方式与系统BLAS链接时。确实,附上 -ff2c选项给出了正确的结果:
$ gfortran-8 -ff2c test.f90 -lblas
$ ./a.out
difference vector: -3.00000000 4.00000000 0.00000000
length of diff vector: 5.00000000

但我想使用最新的 OpenBLAS(比使用 -ff2c 选项)可能更好......

以下是 C 语言中的单独测试(检查问题是否特定于 gfortran)。
// test.c
#include <stdio.h>
float snrm2_( int*, float*, int* );

int main()
{
float b[3] = { -3.0f, 4.0f, 0.0f };
int n = 3, inc = 1;

float dist = snrm2_( &n, b, &inc );

printf( "b = %10.7f %10.7f %10.7f\n", b[0], b[1], b[2] );
printf( "dist = %10.7f\n", dist );
return 0;
}

$ gcc-8 test.c -lblas
$ ./a.out
b = -3.0000000 4.0000000 0.0000000
dist = 0.0000000

$ gcc-8 test.c -lblas -L/usr/local/Cellar/openblas/0.2.20_2/lib
$ ./a.out
b = -3.0000000 4.0000000 0.0000000
dist = 5.0000000

据我尝试, double 版本 (DNRM2) 甚至适用于系统 BLAS,所以问题似乎只出现在单精度版本上(如上页所示)。

关于fortran - BLAS 函数在 Fortran90 中返回零,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50316681/

36 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com