- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在学习 Haskell,并尝试尽可能快地编写 C 代码。对于这个练习,我正在编写 Euler integrator对于一个简单的一维物理系统。
-O3
编译。 .它在 1.166 秒内运行。 -O3
编译。 .它在 21.3 秒内运行。 -O3 -fllvm
编译 Haskell ,它在 4.022 秒内运行。 1e-8 5
.
#include <stdio.h>
double p, v, a, t;
double func(double t) {
return t * t;
}
void euler(double dt) {
double nt = t + dt;
double na = func(nt);
double nv = v + na * dt;
double np = p + nv * dt;
p = np;
v = nv;
a = na;
t = nt;
}
int main(int argc, char ** argv) {
double dt, limit;
sscanf(argv[1], "%lf", &dt);
sscanf(argv[2], "%lf", &limit);
p = 0.0;
v = 0.0;
a = 0.0;
t = 0.0;
while(t < limit) euler(dt);
printf("%f %f %f %f\n", p, v, a, t);
return 0;
}
import System.Environment (getArgs)
data EulerState = EulerState !Double !Double !Double !Double deriving(Show)
type EulerFunction = Double -> Double
main = do
[dt, l] <- fmap (map read) getArgs
print $ runEuler (EulerState 0 0 0 0) (**2) dt l
runEuler :: EulerState -> EulerFunction -> Double -> Double -> EulerState
runEuler s@(EulerState _ _ _ t) f dt limit = let s' = euler s f dt
in case t `compare` limit of
LT -> s' `seq` runEuler s' f dt limit
_ -> s'
euler :: EulerState -> EulerFunction -> Double -> EulerState
euler (EulerState p v a t) f dt = (EulerState p' v' a' t')
where t' = t + dt
a' = f t'
v' = v + a'*dt
p' = p + v'*dt
最佳答案
关键点已经提过了by hammar和 by Philip JF .但是,让我收集它们并添加一些解释。
我会从上到下进行。
data EulerState = EulerState !Double !Double !Double !Double
euler
中未使用该字段, 你得到
Rec {
Main.$wrunEuler [Occ=LoopBreaker]
:: GHC.Prim.Double#
-> GHC.Prim.Double#
-> GHC.Types.Double
-> GHC.Prim.Double#
-> Main.EulerFunction
-> GHC.Prim.Double#
-> GHC.Prim.Double#
-> (# GHC.Types.Double,
GHC.Types.Double,
GHC.Types.Double,
GHC.Types.Double #)
Double#
s需要装箱,有的
Double
未装箱。装箱和拆箱不是非常昂贵的操作,但是在一个本来很紧的循环中,它们可能会消耗大量性能。相同装箱/拆箱问题的另一个实例与
EulerFunction
类型的参数有关。 ,稍后会详细介绍。
-funbox-strict-fields
如
suggested by Philp JF ,或
{-# UNPACK #-}
至少加速场上的编译指示在这里有所帮助,但是只有在消除了功能评估的装箱/拆箱时,差异才变得相关。
print $ runEuler (EulerState 0 0 0 0) (**2) dt l
(** 2)
这里作为一个论点。这与您在 C 中使用的函数不同,相应的 C 函数将是
return pow(t,2);
,并且使用我的 gcc,使用它几乎可以使 C 程序的运行时间增加一倍(不过,clang 没有区别)。最大的性能问题是
(**)
是一个慢函数。由于
(** 2)
与
\x -> x*x
有不同的结果对于许多论点,没有重写规则,因此您确实可以使用 GHC 的 native 代码生成器获得该慢速功能(LLVM 似乎将其替换为
\x -> x*x
然而,由于两个 GHC 后端的巨大性能差异和 clang 结果)。如果您通过
(\x -> x*x)
或
(^ 2)
那里而不是
(** 2)
,你得到乘法(从 7.4 开始有
(^ 2)
的重写规则)。此时,在我的系统上,NCG 生成的代码和 LLVM 生成的代码的性能并没有太大的差异,但是 NCG 快了 10% 左右。
runEuler :: EulerState -> EulerFunction -> Double -> Double -> EulerState
runEuler s@(EulerState _ _ _ t) f dt limit = let s' = euler s f dt
in case t `compare` limit of
LT -> s' `seq` runEuler s' f dt limit
_ -> s'
runEuler
是递归的,因此不能内联。这意味着传递的函数也不能在那里内联,
dt
和
limit
每次迭代也会传递参数。函数不能被内联意味着在循环中,它的参数在传递给函数之前必须被装箱,然后它的结果必须被拆箱。那是昂贵的。这意味着在内联函数参数后无法进行任何优化。
runEuler
可以内联,因此可以内联传递的函数,并且 - 在这种情况下 - 可以消除参数的装箱及其结果的拆箱。此外,甚至更大的影响,在这种情况下,可以消除函数调用并用一台机器操作代替。这导致了一个很好的紧密循环,如图所示
174,208 bytes allocated in the heap
3,800 bytes copied during GC
16,000,174,912 bytes allocated in the heap
1,475,432 bytes copied during GC
关于Haskell - 优化微分方程求解器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12831187/
我正在使用混合效应模型,并且由于我的方法的特殊性我需要解决下面模型的积分,然后制作图表获得的估计值。 换句话说,我需要求解下面的积分: 其中,di^2 是我模型中的 Var3,dh 是混合效应模型对应
我有一个方程组,我想用数值方法求解它。给定起始种子,我想得到一个接近的解决方案。让我解释。 我有一个常量向量,X,值: X <- (c(1,-2,3,4)) 和一个向量 W 的权重: W <- (c(
假设我有以下方程组: a * b = 5 sqrt(a * b^2) = 10 如何求解 R 中 a 和 b 的这些方程? 我想这个问题可以说是一个优化问题,具有以下功能......? fn <- f
我在 R 中有一个简单的通量模型。它归结为两个微分方程,对模型中的两个状态变量进行建模,我们将它们称为 A和 B .它们被计算为四个分量通量的简单差分方程 flux1-flux4 , 5 个参数 p1
R有什么办法吗?求解给定单变量函数的反函数?动机是我以后告诉R使用值向量作为反函数的输入,以便它可以吐出反函数值。 例如,我有函数 y(x) = x^2 ,逆是 y = sqrt(x) .有没有办法R
我在字符串中有以下方程 y = 18774x + 82795 求解x我会这样做:- x = (y-82795) / 18774 我知道y的值 但是方程一直在变化,并且始终采用字符串格式 是否可以简单地
如果我用 diophantine(2*x+3*y-5*z-77) 我收到了这个结果。 {(t_0, -9*t_0 - 5*t_1 + 154, -5*t_0 - 3*t_1 + 77)} 到目前为止还
我正在尝试求解仅限于正解的 ODE,即: dx/dt=f(x) x>=0。 在 MATLAB 中这很容易实现。 R 是否有任何变通方法或包来将解决方案空间限制为仅正值? 这对我来说非常重要,不幸的是没
下面的 ANTLR 文法中的 'expr' 规则显然是相互左递归的。作为一个 ANTLR 新手,我很难解决这个问题。我已经阅读了 ANTLR 引用书中的“解决非 LL(*) 冲突”,但我仍然没有看到解
我有一个关于在 R 中求解函数的可能性的非常基本的问题,但知道答案确实有助于更好地理解 R。 我有以下等式: 0=-100/(1+r)+(100-50)/(1+r)^2+(100-50)/(1+r)^
我正在编写使用递归回溯来解决 8 个皇后问题的代码(将 n 个国际象棋皇后放在 n × n 的棋盘上,这样皇后就不会互相攻击)。 我的任务是创建两个方法:编写一个公共(public)solveQuee
我不知道在以下情况下如何进行,因为最后一个方程没有所有 4 个变量。所以使用了等式下面的代码,但这是错误的......有谁知道如何进行? 方程: 3a + 4b - 5c + d = 10 2a +
假设我们有这个递归关系,它出现在 AVL 树的分析中: F1 = 1 F2 = 2 Fn = Fn - 1 + Fn - 2 + 1(其中 n ≥ 3) 你将如何解决这个递归以获得 F(n) 的封闭形
在Maple中,有谁知道是否存在一个函数来求解变量?例如,我正在尝试求解 r 的 solve4r=(M-x^y)*(r^(-1)) mod (p-1)。所以我知道 M、x、y 和 p 的值,但不知道
我也问过这个here在声音设计论坛上,但问题是沉重的计算机科学/数学,所以它实际上可能属于这个论坛: 因此,通过读取文件中的二进制文件,我能够成功地找到关于 WAV 文件的所有信息,除了 big si
我有以下问题: 设 a 和 b 为 boolean 变量。是否可以设置 a 和 b 的值以使以下表达式的计算结果为 false? b or (((not a) or (not a)) or (a or
我需要用 C 求解这个超越方程: x = 2.0 - 0.5sen(x) 我试过这个: double x, newx, delta; x = 2.0 - 0.5; newx = sin(x); del
我在 Windows 上使用 OpenCV 3.1。 一段代码: RNG rng; // random number generator cv::Mat rVec = (cv::Mat_(3, 1)
我正在尝试求解一个包含 3 个变量和数量可变的方程的方程组。 基本上,系统的长度在 5 到 12 个方程之间,无论有多少个方程,我都试图求解 3 个变量。 看起来像这样: (x-A)**2 + (y-
我正在尝试为有限差分法设计一种算法,但我有点困惑。所讨论的 ODE 是 y''-5y'+10y = 10x,其中 y(0)=0 且 y(1)=100。所以我需要一种方法来以某种方式获得将从关系中乘以“
我是一名优秀的程序员,十分优秀!