fortran - 为什么 Fortran 内部函数 "spread"通常比显式迭代慢-6ren

fortran - 为什么 Fortran 内部函数 "spread"通常比显式迭代慢

转载作者：行者123 更新时间：2023-12-02 20:01:44

25

4

我使用地球物理模型，常见的情况是需要将 2D 数据与 3D 数据相乘、相加等。下面是一个例子。

module benchmarks
  implicit none
  integer, parameter :: n=500
  integer :: k
  real :: d2(n,n)
  real :: d3(n,n,n)
  contains
  ! Iteration
  subroutine benchmark_a(res)
    real, intent(out) :: res(n,n,n)
    do k = 1, size(d3,3)
      res(:,:,k) = d2*d3(:,:,k)
    end do
  end subroutine
  ! Spread
  subroutine benchmark_b(res)
    real, intent(out) :: res(n,n,n)
    res = d3*spread(d2, 3, size(d3,3))
  end subroutine
end module

program main
  use benchmarks
  real :: t, tarray(2)
  real :: res(n,n,n)
  call random_number(d2)
  call random_number(d3)
  ! Iteration
  call dtime(tarray, t)
  call benchmark_a(res)
  call dtime(tarray, t)
  write(*,*) 'Iteration', t
  ! Spread
  call dtime(tarray, t)
  call benchmark_b(res)
  call dtime(tarray, t)
  write(*,*) 'Spread', t
end program

当我以不同的维度大小n运行此程序时，我通常发现spread要慢得多；例如:

Spread   2.09942889
Iteration  0.458283991

有谁知道为什么 spread 方法比显式 for 循环(我认为一般情况下要不惜一切代价避免)慢得多？

最佳答案

这里的基本答案是“不是”。也许对于特定的编译器和特定的环境，内在函数不如显式 DO 循环优化得更好，但不一定是这样。我使用 ifort 19 进行了测试，即使在默认优化级别，SPREAD 内在函数和显式循环也会生成类似的代码，当我更正程序以使用结果时，内在函数会更快。

迭代 0.2187500 0.1376885 价差 9.3750000E-02 0.1376885

我还要提醒您(正如我在对您的问题的评论中所做的那样)，简单化的基准程序通常不会衡量作者认为它们所做的事情。最常见的错误(原始示例和修订示例都显示)是，从未使用被测工作的结果，因此足够聪明的编译器可以简单地蒸发整个操作。事实上，当我使用 ifort 19 构建两个测试用例时，编译器完全删除了所有工作，只留下计时代码。不用说，它运行得相当快。

  implicit none
  integer, parameter :: n=500
  integer :: k
  real :: d2(n,n)
  real :: d3(n,n,n)
  contains
  ! Iteration
  subroutine benchmark_a(res)
    real, intent(out) :: res(n,n,n)
    do k = 1, size(d3,3)
      res(:,:,k) = d2*d3(:,:,k)
    end do
  end subroutine
  ! Spread
  subroutine benchmark_b(res)
    real, intent(out) :: res(n,n,n)
    res = d3*spread(d2, 3, size(d3,3))
  end subroutine
end module

program main
  use benchmarks
  real :: tstart,tend
  real :: res(n,n,n)
  call random_number(d2)
  call random_number(d3)
  ! Iteration
  call cpu_time(tstart)
  call benchmark_a(res)
  call cpu_time(tend)
  write(*,*) 'Iteration', tend-tstart, res(10,10,10)
  ! Spread
  call cpu_time(tstart)
  call benchmark_b(res)
  call cpu_time(tend)
  write(*,*) 'Spread', tend-tstart, res(10,10,10)
end program```

关于fortran - 为什么 Fortran 内部函数 "spread"通常比显式迭代慢，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55717904/

25

4

0

文章推荐： json - 关于如何将 JSON 消息转换为 ASN.1 的想法

文章推荐： r - Shiny:通过单击 valueBox 触发弹出窗口

文章推荐： python - 使用通配符导入的原因是什么？

babeljs - Babel 插件 : what's the difference between "transform-object-rest-spread" and "syntax-object-rest-spread"
关于这两个插件的文档中没有太多详细信息，我知道它们都使 {...obj} 之类的语法有效。但是我如何决定使用哪个插件呢？最佳答案我们在这里有相关文档:https://babeljs.io/doc
javascript - Spread 运算符动态属性更新
我的状态如下所示: state: { 1: {show: false, description: 'one'}, 2: {show: false, description: 'two'
configuration - spread 启动后直接退出
我刚刚尝试启动 spread用于我用于集成不同传感器数据流程的一些工具的通信。启动传播退出后立即显示以下消息: Conf_load_conf_file: using file: spread.con
r - 将非唯一值放入新列的 spread()
这个问题在这里已经有了答案: Transpose / reshape dataframe without "timevar" from long to wide format (9 个回答) 关闭3年
javascript - setState嵌套对象使用es6 spread
我有这样的默认状态: this.state = { location:{ lat: 1234, lng: 3245 } } 所以每次我想更新纬度或经度时我都必须这样做 this
javascript - spread 属性的语法错误
我正在使用 yeoman 生成器 react-webpack .我正在尝试在 Main.js 组件中使用传播属性: require('normalize.css'); require('styles/
javascript - Spread 运算符在数组中添加带有键的元素
我想知道是否可以使用 Spread 运算符在数组中添加具有特定键的元素。 let foo = ['a','b','c']; foo = [...foo,'d']; 在这种情况下，foo[3] 将是 d
javascript - .spread 带有数据重定向
开发数据库时，方法spread将数组值转换为命名参数是必不可少的。但是当解析的数据无法直接映射时如何做同样的事情呢？以下是嵌套事务的简单示例: db.tx(function () { re
algorithm - 从一条线上的点中选取 "spread"
我正面临如下描述的算法问题:给定一条从 0 到 N(非常大的 N)的直线，该直线上的 X 点列表，以及一个数字 Z(0= X 简化为 O(XlogN)。关于algorithm - 从一条线上的点中选
javascript - spread 元素在这里起什么作用
我正在从一本书中学习 react ，在一个示例中，作者以这种方式制作了一个组件 return ( {[...Array(totalStars)].map((n,i)=
python - 如何从数字列表中获取平均 'spread'？
假设我有一个数字列表: some_numbers = [16.0, 16.01, 24.53, 22.99, 22.72, 22.71, 22.2, 21.36, 21.34, 21
javascript - Spread Syntax 创建的是浅拷贝还是深拷贝？
几天来我对浅拷贝和深拷贝的真正定义感到非常困惑。当我阅读关于浅拷贝的 mdn 文档 ( https://developer.mozilla.org/en-US/docs/Glossary/Shall
r - 使用 spread() 将日期时间转换为列名
我有一个包含两列的数据集:第一列名为“键”并包含日期时间(尽管当前采用字符形式)，第二列包含更多日期时间值。我想使用 spread 使键行成为列名。有点复杂，但一旦完成，我会将 tibble 转换为列
r - 如何仅使用目标列的一个值来使用 Spread 函数？
我们有以下数据框 a，内容如下: > a google_prod Value 1 categoria ML 2 google
r - 如何在保持列名顺序的同时扩展 tidyr::spread()？
在使用spread函数时，如何在保持数字排名的情况下进行扩容？ library(tidyverse) data.frame(time = paste0("t_", 1:100)) %>% roww
r - 带有多个键和值的 tidyr::spread()
我认为这已被多次询问，但我找不到合适的词来找到可行的解决方案。我该怎么办 spread()基于多个键的多个值的数据框？我正在处理的简化(我有更多的列要传播，但只有两个键:Id 和 time 给定测
r - 如何 "spread"列表列？
考虑这个简单的例子 mydf mydf # A tibble: 2 x 3 regular_col normal_col weird_col 1
javascript - axios spread() 回调参数数量未知
我需要使用 axios 处理未知数量的 AJAX 请求(1 个或更多)，并且我不确定如何处理响应。我想要一些类似的东西: let urlArray = [] // unknown # of urls
javascript - 有人可以解释以下示例中 ...spread 运算符的使用吗？
这个问题已经有答案了: What are these three dots in React doing? (23 个回答) 已关闭 4 年前。根据我的理解，这就是展开运算符的工作原理: x=[1,
R:tidyr::spread 的编程替代方案？
我有 R data.frames 有不同数量的列。最后一列是数字，其余是字符串。我需要对它们进行排列，以便展开最后一个非数字列。困难在于我想以编程方式执行此操作，因为我不知道列名。例如 df <-

首页

博学

6Ren·AI

商城

fortran - 为什么 Fortran 内部函数 "spread"通常比显式迭代慢