haskell - 诊断并行 monad 性能-6ren

haskell - 诊断并行 monad 性能

转载作者：行者123 更新时间：2023-12-01 00:50:05

27

4

我使用 Attoparsec 库编写了一个字节串解析器:

import qualified Data.ByteString.Char8 as B
import qualified Data.Attoparsec.ByteString.Char8 as P

parseComplex :: P.Parser Complex

我的意图是使用这个解析大(> 5 Gb)文件，因此实现懒惰地使用了这个解析器:

import qualified Data.ByteString.Lazy.Char8 as LB
import qualified Data.Attoparsec.ByteString.Lazy as LP

extr :: LP.Result a -> a

main = do
    rawData <- liftA LB.words (LB.readFile "/mnt/hgfs/outputs/out.txt")
    let formatedData = map (extr.LP.parse parseComplex) rawData
    ...

使用 -O2 在测试文件上执行此操作和 -s标志，我看到:

 3,509,019,048 bytes allocated in the heap
     2,086,240 bytes copied during GC
        58,256 bytes maximum residency (30 sample(s))
       126,240 bytes maximum slop
             2 MB total memory in use (0 MB lost due to fragmentation)

                                  Tot time (elapsed)  Avg pause  Max pause
Gen  0      6737 colls,     0 par    0.03s    0.03s     0.0000s    0.0001s
Gen  1        30 colls,     0 par    0.00s    0.00s     0.0001s    0.0002s

INIT    time    0.00s  (  0.00s elapsed)
MUT     time    0.83s  (  0.83s elapsed)
GC      time    0.04s  (  0.04s elapsed)
EXIT    time    0.00s  (  0.00s elapsed)
Total   time    0.87s  (  0.86s elapsed)

%GC     time       4.3%  (4.3% elapsed)

Alloc rate    4,251,154,493 bytes per MUT second

Productivity  95.6% of total user, 95.8% of total elapsed

由于我独立地将一个函数映射到一个列表上，我认为这段代码可能会从并行化中受益。我以前从未在 Haskell 中做过任何类似的事情，但我在 Control.Monad.Par 上乱搞。库，我写了一个简单的、朴素的、静态的分区函数，我认为它可以并行映射我的解析:

import Control.Monad.Par

parseMap :: [LB.ByteString] -> [Complex]
parseMap x = runPar $ do
    let (as, bs) = force $ splitAt (length x `div` 2) x
    a <- spawnP $ map (extr.LP.parse parseComplex) as 
    b <- spawnP $ map (extr.LP.parse parseComplex) bs
    c <- get a
    d <- get b
    return $ c ++ d

我对这个函数的期望并不高，但是并行计算的性能比顺序计算要差得多。这里是main函数和结果，编译成 -O2 -threaded -rtsopts并使用 +RTS -s -N2 执行:

main = do
    rawData <- liftA LB.words (LB.readFile "/mnt/hgfs/outputs/out.txt")
    let formatedData = parseMap rawData
    ...

 3,641,068,984 bytes allocated in the heap
   356,490,472 bytes copied during GC
    82,325,144 bytes maximum residency (10 sample(s))
    14,182,712 bytes maximum slop
           253 MB total memory in use (0 MB lost due to fragmentation)

                                  Tot time (elapsed)  Avg pause  Max pause
Gen  0      4704 colls,  4704 par    0.50s    0.25s     0.0001s    0.0006s
Gen  1        10 colls,     9 par    0.57s    0.29s     0.0295s    0.1064s

Parallel GC work balance: 19.77% (serial 0%, perfect 100%)

TASKS: 4 (1 bound, 3 peak workers (3 total), using -N2)

SPARKS: 0 (0 converted, 0 overflowed, 0 dud, 0 GC'd, 0 fizzled)

INIT    time    0.00s  (  0.00s elapsed)
MUT     time    1.11s  (  0.72s elapsed)
GC      time    1.07s  (  0.54s elapsed)
EXIT    time    0.02s  (  0.02s elapsed)
Total   time    2.20s  (  1.28s elapsed)

Alloc rate    3,278,811,516 bytes per MUT second

Productivity  51.2% of total user, 88.4% of total elapsed

gc_alloc_block_sync: 149514
whitehole_spin: 0
gen[0].sync: 0
gen[1].sync: 32

如您所见，在并行情况下似乎有很多垃圾收集器事件，并且负载非常不平衡。我使用线程范围分析了执行并得到以下信息:

我可以很清楚地看到在 HEC 1 上运行的垃圾收集器正在中断 HEC 2 上的计算。此外，HEC 1 分配的工作显然比 HEC 2 少。作为测试，我尝试调整两个拆分列表的相对大小以重新-平衡负载，但这样做后我没有看到程序行为的明显差异。我还尝试在不同大小的输入上运行它，使用更大的最小堆分配，并且也只使用 parMap Control.Monad.Par 中包含的功能图书馆，但这些努力也对结果没有影响。

我假设某处存在空间泄漏，可能来自 let (as,bs) = ...分配，因为在并行情况下内存使用量要高得多。这是问题吗？如果是这样，我应该如何解决它？

编辑:按照建议手动拆分输入数据，我现在看到时间上的一些小改进。对于 6m 点输入文件，我手动将文件拆分为两个 3m 点文件和三个 2m 点文件，并分别使用 2 核和 3 核重新运行代码。大致时间如下:

1核:6.5s

2核:5.7s

3核:4.5s

新的 threadscope 配置文件如下所示:

一开始的奇怪行为已经消失，但现在仍然有一些在我看来仍然存在一些明显的负载平衡问题。

最佳答案

首先，我建议引用您的代码审查帖子 (link)向人们提供有关您正在尝试做的事情的更多背景信息。

您的基本问题是您强制 Haskell 使用 length x 将整个文件读入内存。 .您想要做的是流式传输结果，以便在任何时候都尽可能少的文件在内存中。

您拥有的是典型的 map-reduce 计算，因此要将工作负载分为两部分，我的建议是:

打开输入文件两次，创建两个文件句柄。

将第二个句柄放在文件的“中间”。

创建两个计算 - 每个文件句柄一个。

第一个计算将从它的句柄读取，直到它到达“中间”；第二个将从其句柄读取，直到到达文件末尾。

每次计算都会创建一个 Vector Int

每次计算完成后，我们将两个向量组合在一起(按元素相加向量。)

当然，文件的“中间”是靠近文件中间的一行的开始。

棘手的部分是第 4 步，为了简化事情，让我们假设输入文件已经被分成两个单独的文件 part1和 part2 .那么您的计算可能如下所示:

main = do
    content1 <- LB.readFile "part1"
    content2 <- LB.readFile "part2"
    let v = runPar $ do a <- spawnP $ computeVector content1
                        b <- spawnP $ computeVector content2
                        vec1 <- get a
                        vec2 <- get b
                        -- combine vec1 and vec2
                        let vec3 = ...vec1 + vec2...
                        return vec3
    ...

您应该尝试这种方法并确定加速比是多少。如果看起来不错，那么我们就可以弄清楚如何将文件虚拟拆分为多个部分，而无需实际复制数据。

注意 - 我还没有真正运行过这个，所以我不知道是否有怪癖 w.r.t. lazy-IO 和 Par monad，但这种想法在某种形式上应该可行。

关于haskell - 诊断并行 monad 性能，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31798004/

27

4

0

文章推荐： mysql - 即时计算用户年龄，优化。数据库

monads - 为什么要为 monad 定义单位自然变换——这不是 monad 是内仿函数的定义所暗示的吗？
monad 被定义为类别 C 上的内仿函数。假设 C 具有类型 int 和 bool 以及其他构造类型作为对象。现在让我们考虑在这个类别上定义的列表 monad。根据它的定义，list 是一个内仿函
haskell - 整理 Monads - 将 monad 转换器的应用程序转变为新型 monad
我试图采取例如ExceptT a (StateT A M) , 对于某些具体类型 A和单子(monad)M ，并将它们包装到我的新自定义单子(monad)中。首先我确定StateT A M经常出现在
haskell - 使用 monad 转换器和恒等 monad 派生基础 monad
我读到(例如 here 和 here )所有基本单子(monad)(Mabye, Error, ...) 源自其相应的 monad 转换器(MaybeT, ErrorT, ...) 使用身份 mona
monads - 具有两种状态变量类型(输入和输出)的状态单子(monad)仍然是单子(monad)吗？
Haskell 的状态单子(monad) State s a迫使我保持相同类型的 s在整个做 block 期间。但是由于 state monad 实际上只是一个函数，如果我将它定义为 State
free-monad - 自由单子(monad)只是带有接口(interface)的单子(monad)吗？
我一直在阅读some materials on free monads而且我真的不认为我离实现更近了，但我认为我更接近于理解它们是什么! 鉴于上述大量资源，我的理解是自由单子(monad)从“计算”工
haskell - 如果其中一个 monad 包装在 monad 转换器内，是否可以重用 monad 组合函数？
假设我有一个由两个 monad 操作组成的函数: co::Monad m => m a -> m a -> m a 您可以将 co 视为一个高阶函数，它描述两个单子(monad)操作如何相互协作来完成
monads - 为什么验证会违反 monad 法则？
在 SO解释了为什么像 scalaz、cats (Scala) 或 Arrow (Kotlin) 中的 Validation 不能是 monad。据我所知，这是因为他们已经根据应用仿函数对 mona
monads - 我应该避免使用 Monad 失败吗？
我对 Haskell 还很陌生，并且慢慢地意识到 Monad fail 的存在有问题。真实世界的 Haskell warns against its use (“再一次，我们建议您几乎总是避免使用失败
monads - Monad 变压器 – 显式提升
我正在阅读现实世界 Haskell 中的 monad 转换器。在以下示例中，堆栈为 Writer在顶部State在Reader之上在IO之上。 {-# Language GeneralizedNewt
f# - Pause Monad - monadic 类型应该是什么样的？
我看到的典型 Pause monad 实现如下所示(基于 Giulia Costantini 和 Giuseppe Maggiore 编写的 Friendly F# 的第 5 章)。 open Sys
haskell - Monad 与 Monad 变压器
“Monads 允许程序员使用顺序构建 block 来构建计算”，因此它允许我们组合一些计算。如果是这样，那为什么下面的代码不能运行呢？ import Control.Monad.Trans.Stat
haskell - monad 变压器内 monad 的结果
这是我第一次认识 Monad Transformers，所以答案可能很明显。假设我在 StateT MyMonad MyType 类型的 do 块中，我想让另一个相同类型的函数修改状态并返回 MyM
scala - 类型构造函数是单子(monad)还是有单子(monad)？
人们通常说类型是单子(monad)。在某些函数式语言和库(如 Scala/Scalaz)中，您有一个类型构造函数，如 List 或 Option，您可以定义一个与原始类型分离的 Monad 实现。所
haskell - 在单子(monad)变压器类型类中使用列表单子(monad)？
我的目标是创建一个函数，该函数在 ReaderT WriterT 堆栈或 RWS 堆栈中使用 list monad。更一般地说，我如何在 mtl 类型类(如 MonadReader、MonadWrit
haskell - 是否有一个单子(monad)的术语也是一个共单子(monad)？
我只是想知道是否有一个简洁的术语来表示既是单子(monad)又是单子(monad)的东西。我做了一些搜索，我知道these structures exist ，但我还没有找到他们的名字。最佳答案在
haskell - 当两个单子(monad)都没有变压器时合并两个单子(monad)？
我正在玩写一个网络应用程序。在这种情况下，我使用 scotty和 redis ，但是这个问题出现在任何 web/db 组合中。在此之前我使用了 happstack，所以我也喜欢那里的一个例子。 Sco
haskell - 单子(monad)的自由单子(monad)
是 x >>= f相当于 retract (liftF x >>= liftF . f) ? 也就是说，从同样是 Monad 的 Functor 构建的自由 monad 的 monad 实例是否将具有
haskell - monad 和 monad 函数的类约束
我正在尝试编写一个只能包含 Num 的新 monad。当它失败时，它返回 0，就像 Maybe monad 在失败时返回 Nothing 一样。这是我到目前为止所拥有的: data (Num a)
haskell - 在任意 monad 中带有解释器的操作 monad
我正在使用 operational monad作者:海因里希·阿普菲尔姆斯。我想用结果类型的 monad 参数化解释器。我的代码的以下版本编译: {-# LANGUAGE GADTs #-} im
haskell - 如何使用自由单子(monad)来表达延续单子(monad)？
假设所有的 monad 都可以用 Free 来表示。 (如果这不是真的，什么是反例，为什么)？怎么可能the continuation monad或其对应的变压器用 Free 表示或 FreeT -

首页

博学

6Ren·AI

商城

haskell - 诊断并行 monad 性能