data-structures - 如何在函数式编程中实现内存有效的集合的无损操作？-6ren

data-structures - 如何在函数式编程中实现内存有效的集合的无损操作？

转载作者：行者123 更新时间：2023-12-03 12:04:04

26

4

我试图弄清楚如何在函数式编程中实现大型集合的非破坏性操作。如何不必更改或删除单个元素而无需创建一个全新的集合，其中所有元素(即使是未修改的元素)都将在内存中复制。 (即使原始集合将被垃圾回收，我也希望这种集合的内存占用和总体性能会很糟糕。)

这是我到目前为止所走的路:

使用F＃，我想出了一个insert函数，它将列表分为两部分，并在中间引入了一个新元素，似乎没有克隆所有未更改的元素:

// return a list without its first n elements:
// (helper function)
let rec skip list n =
    if n = 0 then
        list
    else
        match list with
        | []    -> []
        | x::xs -> skip xs (n-1)

// return only the first n elements of a list:
// (helper function)
let rec take list n =
    if n = 0 then
        []
    else
        match list with
        | []    -> []
        | x::xs -> x::(take xs (n-1))

// insert a value into a list at the specified zero-based position:
let insert list position value =
    (take list position) @ [value] @ (skip list position)

然后，我使用.NET的 Object.ReferenceEquals检查原始列表中的对象是否在新列表中“回收”:

open System

let (===) x y =
    Object.ReferenceEquals(x, y)

let x = Some(42)
let L = [Some(0); x; Some(43)]
let M = Some(1) |> insert L 1

以下三个表达式的计算结果均为 true，表示在列表 x和 L(即)中都重复使用了 M所引用的值。内存中只有1个该值的副本:

L.[1] === x
M.[2] === x
L.[1] === M.[2]

我的问题:

函数式编程语言是否通常重用值而不是将值克隆到新的内存位置，还是我很幸运地采用了F＃的行为？假设是前者，这是否可以在函数式编程中合理地实现内存有效的集合编辑？

(顺便说一句:我知道 Chris Okasaki's book Purely functional data structures，但是还没有时间彻底阅读它。)

最佳答案

I'm trying to figure out how non-destructive manipulation of large collections is implemented in functional programming, ie. how it is possible to alter or remove single elements without having to create a completely new collection where all elements, even the unmodified ones, will be duplicated in memory.

This page对F＃中的数据结构进行了一些描述和实现。尽管AVL树是我自己的实现，因为其中没有出现在本书中，但它们大多来自Okasaki的Purely Functional Data Structures。

现在，正如您所询问的，关于重用未修改的节点，让我们看一个简单的二叉树:

type 'a tree =
    | Node of 'a tree * 'a * 'a tree
    | Nil

let rec insert v = function
    | Node(l, x, r) as node ->
        if v < x then Node(insert v l, x, r)    // reuses x and r
        elif v > x then Node(l, x, insert v r)  // reuses x and l
        else node
    | Nil -> Node(Nil, v, Nil)

请注意，我们重复使用了一些节点。假设我们从这棵树开始:

当我们在树中插入 e时，会得到一棵全新的树，其中一些节点指向我们的原始树:

如果我们没有对上面的 xs树的引用，则.NET将垃圾回收没有实时引用的任何节点，特别是 d， g和 f节点。

请注意，我们仅沿插入节点的路径修改了节点。这在包括列表在内的大多数不可变数据结构中非常典型。因此，我们创建的节点数完全等于为了插入数据结构而需要遍历的节点数。

Do functional programming languages generally re-use values instead of cloning them to a new memory location, or was I just lucky with F#'s behaviour? Assuming the former, is this how reasonably memory-efficient editing of collections can be implemented in functional programming?

是。

但是，列表并不是很好的数据结构，因为列表上的大多数非平凡操作都需要O(n)时间。

平衡的二叉树支持O(log n)插入，这意味着我们在每个插入上创建O(log n)副本。由于log2(10 ^ 15)为〜= 50，因此对于这些特定的数据结构，开销非常小。即使您在插入/删除后保留每个对象的每个副本，您的内存使用量也会以O(n log n)的速率增加-我认为这非常合理。

关于data-structures - 如何在函数式编程中实现内存有效的集合的无损操作？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/1993760/

26

4

0

文章推荐： javascript - 使用 JavaScript 对某些日期进行排序

文章推荐： java - 初始化ThreadLocal变量时传递参数

文章推荐： javascript - 从 AngularJS 指令获取 HTML 元素类

文章推荐： sockets - Unix域套接字队列详细信息

mysql - WHERE(集合)IN(集合)
编辑:我似乎问错了这个问题。我正在尝试寻找一种方法来查询一个集合是否在另一个集合中可用。例如: SELECT * FROM something WHERE (1, 3) IN (1, 2, 3, 4
jquery - $.each([集合]) 与 $([集合]).each()
这两种方法似乎 produce the same results ，但我一直很难真正说服人们第二种方法有效，因为它显然并不为人所知。 // Create some data var foo = { '
kotlin - 为什么我们在Kotlin中仅使用[列表， map ，集合]集合？
我一直在学习Kotlin，并且遇到过Collections API。在Kotlin之前，我一直在学习Java，并且我知道Java中有很多不同类型的Collections API。例如，我们使用List
Java addAll(集合)与 new ArrayList(集合)
为什么我会得到不同的行为: Collection col2 = new ArrayList(col); 集合 col2 = new ArrayList(); col2.addAll(col) 我正在与
javascript: 集合[id][prop] = 集合[id][prop] || []//将空数组分配给对象时出现问题
所以我有一个代表专辑信息的 JSON 对象。给定“function updateRecords(id, prop, value)”我希望能够更新每个条目。正确的完成代码如下。我得到了指示，粗体部分，
java - 我需要哪种 Java 对象类型(集合/列表/集合/其他)？
我想存储一个对象集合，这些对象根据它们所代表的值进行键控。这些键可以重复。例如: [4] => Bob [5] => Mary [5] => Sue [9] => Steve [10] =>
collections - ArrayList(集合 c)VS HashSet(集合 c)
在检查 ArrayList API 时，我注意到一些看起来很奇怪的东西。确实，这里是 ArrayList 构造函数实现，其中 Collection 作为参数传递: public ArrayList(
collections - 如何在我的 YAML Swagger 定义中将属性类型定义为字符串列表(列表、集合、数组、集合)
我正在为 API 编写一个 swagger 定义文件。 API 是用于 GET 请求的 /path/to/my/api: get: summary: My Custom API d
java - 如何将 Scala 集合 Seq[(Int, Seq[String])] 转换为 Java 集合 List[(int, List[String])]？
我知道scala.collection包中有两个非常有用的对象，可以帮助我们实现这个目标: JavaConverters(如果我想明确说明并准确说明我要转换的内容) JavaConversions(如
Automapper 集合
我已经阅读了无数其他帖子，但似乎无法弄清楚发生了什么，所以是时候寻求帮助了。我正在尝试将包含集合的域实体映射到也包含集合的 dtos。这是一个原始示例； (我提前为代码墙道歉，我尽量保持简短):
Java:集合
我正在创建一个具有 ArrayList 的类，因此当我调用构造函数时，它会初始化该数组: public class ElementsList { private ArrayList list;
polymer this.$ 集合
我正在阅读事件指南和指南的开头，它说: You can also add an event listener to any element in the this.$ collection using
Python - 集合
我是 Python 新手，想知道如何使用键在字典中存储不同数据类型的列表例如 - {[Key1,int1,int1,String1] , [Key2,int2,int2,String2], [Key
C# 集合
int[] mylist = { 2, 4, 5 }; IEnumerable list1 = mylist; list1.ToList().Add(1); // why 1 does not get
Java 集合
我在 UI 表单中的每一行之后将以下内容添加到 HashMap 集合中声明 Map> map = new HashMap>(); List valSetOne = new ArrayList();
Java - 集合
我正在开发我的第一个 Java 项目，我有一个问题。问题应该很简单(虽然代码不是那么短，但没有理由被吓倒:))。我创建了一个基本的角色扮演游戏，并且有一个定义每个角色的抽象类“Character”。在
MongoDB 集合
我正在开发一款应用程序，可以为用户收集推文、Facebook 状态和 Facebook 照片。目前，用户确切地设定了他们希望这种收获发生的时间和时间，并且蜘蛛会在此期间拉取数据。 when 和 to
C# 集合？
有谁知道在 C# 中是否有与 Java 的 Set 集合等效的好方法？我知道您可以通过填充但忽略值来使用 Dictionary 或 HashTable 在某种程度上模仿集合，但这不是一种非常优雅的方式
oracle 集合
EXISTS 该函数返回集合中第一个元素的索引，如果集合为空，返回NULLNULLNULL Collecti
07、RDF 集合
RDF集合是通过属性 rdf:parseType="Collection" 来描述仅包含指定成员的组 rdf:parseType="Collection" 属

首页

博学

6Ren·AI

商城

data-structures - 如何在函数式编程中实现内存有效的集合的无损操作？