gpt4 book ai didi

haskell - 管理 FP 中的复杂状态

转载 作者:行者123 更新时间:2023-12-02 19:03:31 25 4
gpt4 key购买 nike

我想编写一个多实体系统的模拟。我相信这样的系统激发了 Simula 和 OOP 的创建,其中每个对象将维护自己的状态,运行时将管理整个系统(例如停止线程、序列化数据)。

另一方面,我希望能够倒带、更改模拟参数并比较结果。因此,不变性听起来很棒(至少可以解决由于跟踪可能的冗余数据而导致的几乎某些垃圾收集问题)。

但是我不知道如何建模。 这是否意味着我必须将每个交互实体放入一个巨大的结构中,其中每个对象更新都需要首先找到它?

我担心这种方法会严重影响性能,因为 GC 开销和不断的结构遍历而不是在内存中保留实体的一个固定地址。

更新

为了澄清,这个问题询问是否有除了创建包含所有可能交互的实体作为根的单个结构之外的任何其他可用设计选项。直观上,这样的结构意味着对数的单次更新惩罚,除非更新以某种方式“聚集”以摊销。

是否存在可以对交互进行不同建模的已知系统?例如,冷/热数据存储优化?

经过一些研究,似乎与 N 体模拟有联系,系统可以集群,但我还不熟悉它。即便如此,这是否也意味着我需要拥有单一的集群结构?

最佳答案

虽然我同意人们评论说这是一个模糊的问题,但我仍然会尝试解决提出的一些问题。

确实,不变性会带来一些性能开销,因为当您使用可变状态时,您可以就地更新一些值,而使用不可变状态时,必须进行一些复制。

然而,一个常见的误解是,这会导致大“对象”图出现问题。没必要。

考虑 Haskell 数据结构:

data BigDataStructure = BigDataStructure {
bigChild1 :: AnotherBigDataStructure
, bigChild2 :: YetAnotherBigDataStructure
-- more elements go here...
, bigChildN :: Whatever }
deriving (Show, Eq)

想象一下,每个子元素本身都很大而且很复杂。如果您想更改,例如 bigChild2,您可以编写如下内容:

updatedValue = myValue { bigChild2 = updatedChild }

当您这样做时,会发生一些数据复制,但通常比大多数人想象的要少。此表达式确实创建了一个新的 BigDataStructure 记录,但它不会“深层复制”其任何值。它只是重用 bigChild1updatedChildbigChildN 和所有其他值,因为它们是不可变的。

理论上(但我们稍后会讨论这一点),数据结构越扁平,应该启用更多的数据共享。另一方面,如果您有一些深度嵌套的数据结构,并且需要更新叶子,则需要创建这些叶子的直接父代的副本,加上这些父代的父代,以及它们的父代:好吧,一直到根源。那可能会很贵。

虽然这是理论,但几十年来我们都知道尝试预测软件的性能是不切实际的。相反,尝试测量它。

虽然OP表明涉及重要数据,但它没有说明多少数据,也没有说明将运行模拟的系统的硬件规范。所以,如Eric Lippert explains so well ,最能回答有关绩效问题的人就是你。

<小时/>

附注根据我的经验,当我开始遇到性能问题时,我需要在设计系统时发挥创意。高效的数据结构可以解决许多性能问题。 OOP 中的情况与 FP 中的情况一样。

关于haskell - 管理 FP 中的复杂状态,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48471149/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com