haskell - 使用矢量的风格与性能-6ren

haskell - 使用矢量的风格与性能

转载作者：行者123 更新时间：2023-12-03 22:30:03

25

4

这是代码:

{-# LANGUAGE FlexibleContexts #-}

import Data.Int
import qualified Data.Vector.Unboxed as U
import qualified Data.Vector.Generic as V

{-# NOINLINE f #-} -- Note the 'NO'
--f :: (Num r, V.Vector v r) => v r -> v r -> v r
--f :: (V.Vector v Int64) => v Int64 -> v Int64 -> v Int64
--f :: (U.Unbox r, Num r) => U.Vector r -> U.Vector r -> U.Vector r
f :: U.Vector Int64 -> U.Vector Int64 -> U.Vector Int64
f = V.zipWith (+) -- or U.zipWith, it doesn't make a difference

main = do
    let iters = 100
        dim = 221184
        y = U.replicate dim 0 :: U.Vector Int64
    let ans = iterate ((f y)) y !! iters
    putStr $ (show $ U.sum ans)

我用 ghc 7.6.2 编译和 -O2 ，运行耗时 1.7 秒。

我尝试了几个不同版本的 f :

f x = U.zipWith (+) x

f x = (U.zipWith (+) x) . id

f x y = U.zipWith (+) x y

版本 1 与原始版本相同，而版本 2 和 3 的运行时间不到 0.09 秒(而且 INLINING f 不会改变任何内容)。

我还注意到，如果我制作 f多态(具有上述三个签名中的任何一个)，即使使用“快速”定义(即 2 或 3)，它也会减慢……精确到 1.7 秒。这让我想知道原始问题是否可能是由于(缺乏)类型推断造成的，即使我明确给出了 Vector 类型和元素类型的类型。

我也有兴趣添加整数模 q :

newtype Zq q i = Zq {unZq :: i}

如添加 Int64 s，如果我用指定的每种类型编写一个函数，

h :: U.Vector (Zq Q17 Int64) -> U.Vector (Zq Q17 Int64) -> U.Vector (Zq Q17 Int64)

与保留任何多态性相比，我获得了一个数量级的性能

h :: (Modulus q) => U.Vector (Zq q Int64) -> U.Vector (Zq q Int64) -> U.Vector (Zq q Int64)

不过我至少应该可以去掉特定的幻影类型!它应该被编译出来，因为我正在处理一个 newtype .

以下是我的问题:

放缓从何而来？

f 的第 2 版和第 3 版发生了什么以任何方式影响性能？这对我来说似乎是一个错误，(相当于)编码风格会影响这样的性能。 Vector 之外是否还有其他示例，其中部分应用函数或其他风格选择会影响性能？

为什么多态性使我慢了一个数量级，而与多态性的位置无关(即在向量类型中，在 Num 类型中，两者或幻像类型中)？我知道多态会使代码变慢，但这很 absurd 。它周围有黑客吗？

EDIT 1

I filed a issue with the Vector library page. I found a GHC issue relating to this problem.

EDIT2

I rewrote the question after gaining some insight from @kqr's answer. Below is the original for reference.

--------------原问题--------------------

这是代码:

{-# LANGUAGE FlexibleContexts #-}

import Control.DeepSeq
import Data.Int
import qualified Data.Vector.Unboxed as U
import qualified Data.Vector.Generic as V

{-# NOINLINE f #-} -- Note the 'NO'
--f :: (Num r, V.Vector v r) => v r -> v r -> v r
--f :: (V.Vector v Int64) => v Int64 -> v Int64 -> v Int64
--f :: (U.Unbox r, Num r) => U.Vector r -> U.Vector r -> U.Vector r
f :: U.Vector Int64 -> U.Vector Int64 -> U.Vector Int64
f = V.zipWith (+)

main = do
    let iters = 100
        dim = 221184
        y = U.replicate dim 0 :: U.Vector Int64
    let ans = iterate ((f y)) y !! iters
    putStr $ (show $ U.sum ans)

我用 ghc 7.6.2 编译和 -O2 ，运行耗时 1.7 秒。

我尝试了几个不同版本的 f :

f x = U.zipWith (+) x

f x = (U.zipWith (+) x) . U.force

f x = (U.zipWith (+) x) . Control.DeepSeq.force)

f x = (U.zipWith (+) x) . (\z -> z `seq` z)

f x = (U.zipWith (+) x) . id

f x y = U.zipWith (+) x y

版本 1 与原始版本相同，版本 2 运行时间为 0.111 秒，版本 3-6 运行时间不到 0.09 秒( INLINING f 不会改变任何内容)。

因此，数量级的放缓似乎是由于 force 以来的懒惰造成的。有帮助，但我不确定懒惰的来源。不允许未装箱的类型偷懒，对吗？

我试着写一个严格版本的 iterate ，认为向量本身一定是懒惰的:

{-# INLINE iterate' #-}
iterate' :: (NFData a) => (a -> a) -> a -> [a]
iterate' f x =  x `seq` x : iterate' f (f x)

但是用 f的免点版本，这根本没有帮助。

我还注意到其他一些事情，这可能只是一个巧合和红鲱鱼:
如果我做 f多态(具有上述三个签名中的任何一个)，即使使用“快速”定义，它也会减慢……精确到 1.7 秒。这让我想知道最初的问题是否可能是由于(缺乏)类型推断造成的，即使一切都应该很好地推断出来。

以下是我的问题:

放缓从何而来？

为什么用force作曲帮助，但使用严格的 iterate不是吗？

为什么是 U.force比DeepSeq.force差?我不知道是什么 U.force应该这样做，但听起来很像 DeepSeq.force ，似乎也有类似的效果。

为什么多态性会使我慢一个数量级，而与多态性的位置无关(即在向量类型中，在 Num 类型中，或两者兼有)？

为什么版本 5 和 6 根本不应该有任何严格的含义，就像严格的函数一样快？

正如@kqr 指出的那样，问题似乎不在于严格。所以我编写函数的方式导致了泛型 zipWith使用而不是未装箱的特定版本。这只是 GHC 和 Vector 库之间的侥幸，还是这里可以说一些更一般的东西？

最佳答案

虽然我没有您想要的明确答案，但有两件事可能会对您有所帮助。

首先是x `seq` x在语义和计算上都与 x 相同.维基说关于 seq :

A common misconception regarding seq is that seq x "evaluates" x. Well, sort of. seq doesn't evaluate anything just by virtue of existing in the source file, all it does is introduce an artificial data dependency of one value on another: when the result of seq is evaluated, the first argument must also (sort of; see below) be evaluated.

As an example, suppose x :: Integer, then seq x b behaves essentially like if x == 0 then b else b – unconditionally equal to b, but forcing x along the way. In particular, the expression x `seq` x is completely redundant, and always has exactly the same effect as just writing x.

第一段说的是写 seq a b并不意味着 a会在这一瞬间神奇地得到评估，这意味着 a将尽快得到评估 b需要评估。这可能会在程序的后期发生，也可能永远不会发生。当你从那个角度看它时，很明显 seq x x是一种冗余，因为它所说的只是“在需要评估 x 时立即评估 x”。如果你刚刚写了 x，那当然会发生什么。 .

这对你有两个影响:

你的“严”iterate'功能实际上并不比没有 seq 时更严格.事实上，我很难想象 iterate函数可能变得比现在更严格。您不能使列表的尾部严格，因为它是无限的。您可以做的主要事情是强制“累加器”，f x ，但这样做不会显着提高我的系统的性能。 [1]

抓那个。您的严格iterate'与我的 bang 模式版本完全相同。看评论。

写作 (\z -> z `seq` z)没有给你一个严格的身份函数，我认为这就是你想要的。事实上，通用标识函数与您将得到的一样严格——它会在需要时立即评估其结果。

但是，我查看了 GHC 生成的核心

U.zipWith (+) y

和

U.zipWith (+) y . id

我未经训练的眼睛只能发现一个很大的不同。第一个只使用一个普通的 Data.Vector.Generic.zipWith (这就是你的多态巧合可能发挥作用的地方——如果 GHC 选择一个泛型 zipWith，它当然会像代码是多态的一样执行!)而后者将这个单一的函数调用分解成近 90 行状态 monad 代码和未打包的机器类型。

状态 monad 代码看起来几乎就像你用命令式语言编写的循环和破坏性更新，所以我认为它非常适合运行它的机器。如果我不那么着急，我会花更长时间看看它是如何工作的，以及为什么 GHC 突然决定它需要一个紧密的循环。我已经为自己和其他想要查看的人一样附加了生成的核心。 [2]

[1]:沿途强制累加器:(这是你已经在做的，我误解了代码!)

{-# LANGUAGE BangPatterns #-}
iterate' f !x = x : iterate f (f x)

[2]: What core U.zipWith (+) y . id gets translated into.

关于haskell - 使用矢量的风格与性能，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/19803949/

25

4

0

文章推荐： r - 无法为并行集群打开套接字

文章推荐： jquery - 选择没有 href 的 anchor

文章推荐： JQuery-Mobile可折叠slideDown效果

文章推荐： file - Jenkins 在成功构建后提交文件

visual-studio-code - 如何将 TextMate 语法(XML 风格)转换为 YAML 或 JSON 风格
Textmate 语法(.tmLanguage 文件)有时以 XML 格式表示。我想转换为更易读的格式(即 JSON 或 YAML)以集成到 VS Code 语法突出显示扩展中。为了澄清我的意思，
Pandas 风格 - 如何隐藏列标签？
如何通过 pandas 样式隐藏列标签？有一个 hide_index() 方法可以删除索引行，不幸的是 hide_column() 标签会删除整个列(标题和数据)。我只想隐藏标题。谢谢! 最佳答案 s
SOA 风格 - 共享数据
我正在考虑为一组服务使用 SOA 架构来支持我咨询的业务，以前我们使用数据库集成，其中每个应用程序从共享的 MS SQL 数据库中挑选出它需要的东西并使用它等等。我们有各种与怪物数据库(包括 java
Objective-C 风格
所以我有以下代码，我想知道 Objective-C 中哪种“风格”被认为更好。选项 1: id temp = [dictionary objectForKey: @"aBooleanValue"];
空类参数列表的 Scala 风格
当创建一个没有类参数的对象时，我很难决定是否应该包含空括号。一个具体的例子:我正在与现有的 Java 代码交互，并创建一个实现名为 EventResponder 的接口(interface)的对象。我
java - 风格？ Java中复制构造函数签名的方法
我有一个抽象类Stack和一个扩展它的类:MyStack。我需要为 MyStack 创建一个复制构造函数。只传入 MyStack 对象更好，还是传入任何 Stack 对象更好？ public MySt
Python 风格，命名常量参数
我正在考虑将那些在函数体中未修改的 Python 函数参数拼写为 ALL_UPPERCASE，向此类 API 的用户发出信号，表明传递的值不会被修改(如果一切都如广告所言，无论如何) )。我不知道这会
Android 风格+构建类型特定的依赖项
我的 build.gradle 文件、staging、stable 和 production 以及默认构建类型 debug 和 release。对于其中的每一个，我都有不同的 AAR 文件，例如，我有
头文件的 C++ 风格
假设我有以下文件: main.cpp 例程.cpp 例程.h 进一步假设 main.cpp 调用了在 routine.cpp 中定义的函数 routine()，但是 routine.cpp 还包含仅由
用于创建外键的 MySQL 风格
我对此进行了一些搜索，但实际上我还没有找到 MySQL 中用于创建外键的样式概念是什么 - 在创建表定义中或在 alter 语句中。谢谢。最佳答案何时创建外键: 如果在创建表时明确需要外键，则在创
Android 风格 ACTION_CHANGE_LIVE_WALLPAPER
您好，我正在尝试将 Android 应用风格(免费且完整)实现为动态壁纸。在 Eclipse 中，我曾经使用以下代码从我自己的 Android Activity 打开动态壁纸预览: I
具有不同依赖项和相同类文件的 Android 风格
我的 Android 应用程序有两种不同的风格，lite 和 pro。在应用程序中，我有一个名为 customFragment.java 的类，它包含在 main 中(不同风格之间没有区别)并且还包含
嵌套路径导入的 pythonic 风格
我有一个包含多个子目录的项目，如下所示: /opt/exampleProject/src ├── __init__.py ├── dir1 │ ├── __init__.py │ ├──
c: 风格:就地改变变量
假设我们有类似的东西 int f(int n); .... do{ int a = b; int b = f(a); } 这样说有没有风险 do{ int b = f(b);
Python 风格 - 语句是否应该嵌套在不需要上下文的上下文管理器中？
是否有风格指导或理由来选择其中一种模式而不是另一种？最小化上下文管理器下的代码量“感觉”更干净，但我无法指出具体原因。这可能只是偏好，并没有关于此事的官方指导。 1) 里面的所有代码都有上下文。 w
访问模块和类元素的 Ruby 风格
module Hints module Designer def self.message "Hello, World!" end
具有不同基本主题的 Android 风格
我正在开发一个具有多种风格的 android 项目。这很好用，我可以自定义应用程序的元素，例如颜色和字符串资源。我想让一些风格基于 AppCompat 浅色主题，一些基于 AppCompat 深色
Java Lambda 风格
因此，这不起作用，因为 seatsAvailable 是最终的。如何使用更多的 lambda 风格的从头开始的方式来完成我想要完成的事情？ final boolean seatsAvailable =
用于设置核心亲和性的 C++ 风格？
考虑以下代码: cpu_set_t cpuset; CPU_ZERO(&cpuset); CPU_SET(0, &cpuset); sched_setaffinity(0, sizeof(cpuset
Java 异常处理 - 风格
从历史上看，我总是这样编写我的异常处理代码: Cursor cursor = null; try { cursor = db.openCursor(null, null

首页

博学

6Ren·AI

商城

haskell - 使用矢量的风格与性能