c - 使用大量内存的堆实现

c - 使用大量内存的堆实现 - C

转载作者：太空狗更新时间：2023-10-29 15:39:16

我正在用 C 编写一个 min-heap 的实现，作为 Dijkstra 算法的一部分。我已经了解了所有细节，并且我的测试程序通过了 valgrind 测试，但它在此过程中分配了荒谬的内存量。最终测试是在 INT_MAX 的 INT_MAX 网格上(坐标只是整数)，我在测试时出现了 SIGXCPU 错误。即使我只是将 16k 位置插入队列然后删除所有内容，它仍然需要很长时间并分配超过 8 MB。当我在巨大的网格测试用例上运行它时，在我手动退出之前它可以达到 500 MB。可能发生了什么？这是我的部分代码:

struct position {
    int x;
    int y
};

typedef struct elt {
    int priority;
    int distance;
    struct position p;
} *Elt;

typedef struct heap {
    int size;
    int capacity;
    Elt *elts;
} *Heap;

void heap_insert(Heap h, Elt e, int *counter) {
    if(h->capacity < (h->size + 2)) {
        h->elts = realloc(h->elts, h->capacity * sizeof(Elt) * 2);
        h->capacity *= 2;
    }
    h->elts[h->size] = malloc(sizeof(*Elt));
    elt_assign(h->elts[h->size], e);
    h->size++;
    heapify(h->size, h->elts);
    *counter = *counter + 1;
}

我的所有其他函数都一次性地、在函数中或根本不进行内存管理。本例中的初始大小是 64，但我从 1024 开始得到了相同的效果。我也试过限制队列的大小，但无济于事。我很确定这不是我堆砌的代码，但这是为了以防万一

static void floatDown(int n, Elt *a, int pos) {
    Elt x = malloc(sizeof(struct elt));
    elt_assign(x, a[pos]);
    for(;;) {
        if(Child(pos, 1) < n && a[Child(pos, 1)]->priority < a[Child(pos, 0)]->priority) {
            if(a[Child(pos, 1)]->priority < x->priority) {
                elt_assign(a[pos], a[Child(pos, 1)]);
                pos = Child(pos, 1);
            } else {
                break;
            }
        } else if(Child(pos, 0) < n && a[Child(pos, 0)]->priority < x->priority) {
            elt_assign(a[pos], a[Child(pos, 0)]);
            pos = Child(pos, 0);
        } else {
            break;
        }
    }
    elt_assign(a[pos], x);
    free(x);
}

static void heapify(int n, Elt *a) {
    for(int i = n - 1; i >= 0; i--) {
        floatDown(n, a, i);
    }
}

如有任何帮助，我们将不胜感激。

最佳答案

这是我的工作理论。我愿意发现我错了，但没有其余代码，我无法检测、运行和测试它。

的间接... struct heap { ... Elt *elts; } ... 当 typedef struct elt {...} *Elt; 节省了复制 4 个整数并将其替换为复制 1 个指针的成本，但复制速度很快，而且它只发生 log2(N) 次。

相反，每个 struct elt 都是单独 malloc 的。不用四处寻找 malloc block 的实际大小，我们可以估计平均会浪费 N/2 sizeof(struct elt)(实际上，我认为在我的机器上更糟)。

它也可能创建不连续的内存块(通过将小块放在大块之间)，因此 realloc 必须总是分配一个更大的 block ，因此重用以前的 block 会更难。在这种特定情况下，我认为这与内部碎片造成的浪费或 malloc 的大量调用无关紧要。

它也可能会创建一个“缓存破坏者”。实际值分布在整个内存中，并且由于 malloc'd struct elt block 的内部碎片，缓存行相对稀疏。

所以替换:

typedef struct elt {
    int priority;
    int distance;
    struct position p;
} *Elt;

typedef struct heap {
    int size;
    int capacity;
    Elt *elts;
} *Heap;

与

typedef struct elt {
    int priority;
    int distance;
    struct position p;
} Elt;    // no longer a pointer

typedef struct heap {
    int size;
    int capacity;
    Elt *elts;
} *Heap;

和改变:

void heap_insert(Heap h, Elt e, int *counter) {
    if(h->capacity < (h->size + 2)) {
        h->elts = realloc(h->elts, h->capacity * sizeof(Elt) * 2);
        h->capacity *= 2;
    }
    h->elts[h->size] = malloc(sizeof(*Elt));
    elt_assign(h->elts[h->size], e);
    h->size++;
    heapify(h->size, h->elts);
    *counter = *counter + 1;
}

到

void heap_insert(Heap h, Elt e, int *counter) {
    if(h->capacity < (h->size + 2)) {
        h->elts = realloc(h->elts, h->capacity * sizeof(Elt) * 2);
        h->capacity *= 2;
    }
    h->elts[h->size] = e;  // no longer need to malloc
    h->size++;
    heapify(h->size, h->elts);
    *counter = *counter + 1;
}

因此，用于保存堆的 malloc'd/realloc' 内存量应大致为 2 * N * sizeof(struct elt)。可以更改函数/宏 elt_assign 以隐藏其他更改。

然后通过更改进一步减少 malloc 的数量:

static void floatDown(int n, Elt *a, int pos) {
    Elt x = malloc(sizeof(struct elt));
    elt_assign(x, a[pos]);
...
    elt_assign(a[pos], x);
    free(x);
}

到

static void floatDown(int n, Elt *a, int pos) {
    Elt x = a[pos];
...
    a[pos] = x;
}

这应该会进一步减少 malloc'ed 和 free' 的内存量。

本质上，应该只有(大约)log2(N) 次 realloc 调用。 realloc 更有可能只是扩展现有 block 而不是复制。

编辑:

heap_insert 中有一个比内存分配更大的问题:

void heap_insert(Heap h, Elt e, int *counter) {
    ...
    heapify(h->size, h->elts);
    ...
}

heapify 为插入堆中的每个元素调用，即 heapify 被调用 N 次。 heapify 是:

static void heapify(int n, Elt *a) {
    for(int i = n - 1; i >= 0; i--) {
        floatDown(n, a, i);
    }
}

到目前为止，对于插入的每个元素，这会在堆中的每个元素上调用floatdown。所以 heap_insert 的运行时间大约为 (N^2)/2(即 O(N^2))。

我相信 heap_insert 应该为它添加到堆中的每个元素使用 floatDown，而不是 heapify。

关于c - 使用大量内存的堆实现 - C，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/10109350/

文章推荐： c - 寻找有关 Linux 系统调用的详细文档

文章推荐： c - 8051(8 位)微 Controller 上的意外位移结果

文章推荐： javascript - 单击文本时选择文本就像 "Ctrl+A"？

文章推荐： android 被动位置提供

java - 自定义 JPA 实现//现有的无 SQL JPA 实现
背景: 我最近一直在使用 JPA，我为相当大的关系数据库项目生成持久层的轻松程度给我留下了深刻的印象。我们公司使用大量非 SQL 数据库，特别是面向列的数据库。我对可能对这些数据库使用 JPA 有一
java - 未由 S3FileSystem FileSystem 实现 Hadoop Jar 实现
我已经在我的 maven pom 中添加了这些构建配置，因为我希望将 Apache Solr 依赖项与 Jar 捆绑在一起。否则我得到了 SolarServerException: ClassNotF
c# - 实现 "Inherit"(实现)通用接口(interface)的接口(interface)？
interface ITurtle { void Fight(); void EatPizza(); } interface ILeonardo : ITurtle {
java - 任何 JPA 实现(或更广泛的 Java ORM 实现)是否支持可更新游标
我希望可用于 Java 的对象/关系映射 (ORM) 工具之一能够满足这些要求: 使用 JPA 或 native SQL 查询获取大量行并将其作为实体对象返回。允许在行(实体)中进行迭代，并在对当前
generics - 如果我为 B 实现 From ，是否也会为 Vec 实现 From>？
好像没有，因为我有实现From for 的代码, 我可以转换 A到 B与 .into() , 但同样的事情不适用于 Vec .into()一个Vec . 要么我搞砸了阻止实现派生的事情，要么这不应该发

c# - 在 C# 中，如果 A 实现 IX 并且 B 继承自 A ，是否必然遵循 B 实现 IX？
在 C# 中，如果 A 实现 IX 并且 B 继承自 A ，是否必然遵循 B 实现 IX？如果是，是因为 LSP 吗？之间有什么区别吗: 1. Interface IX; Class A : IX;

OpenVG 实现？
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the

performance - 实现 (^)
我正在阅读标准haskell库的(^)的实现代码: (^) :: (Num a, Integral b) => a -> b -> a x0 ^ y0 | y0 a -> b ->a expo x0

博弈树的C++实现
我将把国际象棋游戏表示为 C++ 结构。我认为，最好的选择是树结构(因为在每个深度我们都有几个可能的移动)。这是一个好的方法吗？ struct TreeElement{ SomeMoveType

字符串匹配alg的c++实现
我正在为用户名数据库实现字符串匹配算法。我的方法采用现有的用户名数据库和用户想要的新用户名，然后检查用户名是否已被占用。如果采用该方法，则该方法应该返回带有数据库中未采用的数字的用户名。例子: “贾

图算法的C++实现
我正在尝试实现 Breadth-first search algorithm , 为了找到两个顶点之间的最短距离。我开发了一个 Queue 对象来保存和检索对象，并且我有一个二维数组来保存两个给定顶点

Python A* 实现
我目前正在 ika 中开发我的 Python 游戏，它使用 python 2.5 我决定为 AI 使用 A* 寻路。然而，我发现它对我的需要来说太慢了(3-4 个敌人可能会落后于游戏，但我想供应 4-

DHT的C++实现
我正在寻找 Kademlia 的开源实现C/C++ 中的分布式哈希表。它必须是轻量级和跨平台的(win/linux/mac)。它必须能够将信息发布到 DHT 并检索它。最佳答案 OpenDHT是

C++实现
我在一本书中读到这一行:-“当我们要求 C++ 实现运行程序时，它会通过调用此函数来实现。” 而且我想知道“C++ 实现”是什么意思或具体是什么。帮忙!？最佳答案 “C++ 实现”是指编译器加上链接

背包分支定界的C++实现
我正在尝试使用分支定界的 C++ 实现这个背包问题。此网站上有一个 Java 版本:Implementing branch and bound for knapsack 我试图让我的 C++ 版本打印

FNV哈希的C#实现
在很多情况下，我需要在 C# 中访问合适的哈希算法，从重写 GetHashCode 到对数据执行快速比较/查找。我发现 FNV 哈希是一种非常简单/好/快速的哈希算法。但是，我从未见过 C# 实现的

LRU缓存替换策略及C#实现
目录 LRU缓存替换策略核心思想不适用场景算法基本实现算法优化

大角度非迭代的空间坐标旋转C#实现
1. 绪论在前面文章中提到空间直角坐标系相互转换，测绘坐标转换时，一般涉及到的情况是：两个直角坐标系的小角度转换。这个就是我们经常在测绘数据处理中，WGS-84坐标系、54北京坐标系

实现.Net7下的数据库定时检查
在软件开发过程中，有时候我们需要定时地检查数据库中的数据，并在发现新增数据时触发一个动作。为了实现这个需求，我们在 .Net 7 下进行一次简单的演示. PeriodicTimer .

查找算法之二分查找的C++实现
二分查找二分查找算法，说白了就是在有序的数组里面给予一个存在数组里面的值key，然后将其先和数组中间的比较，如果key大于中间值，进行下一次mid后面的比较，直到找到相等的，就可以得到它的位置。

太空狗

个人简介
我是一名优秀的程序员,十分优秀！

作者热门文章

c - 在位数组中找到第一个零

linux - Unix 显示有关匹配两种模式之一的文件的信息

正则表达式替换多个文件

linux - 隐藏来自 xtrace 的命令

滴滴打车优惠券免费领取

全站热门文章

RL基础|如何使用OpenAIGym接口，搭建自定义RL环境（详细版）

开源-Ideal库-获取特殊时间扩展方法（四）

LVM使用与扩容总结

现代IT基础设施管理（1）：Terraform初识和小试牛刀

推荐一个Star超过2K的.Net轻量级的CMS开源项目

【Playwright+Python】系列（九）Playwright调用Chrome插件，小白也能事半功倍

(1)Pytorch深度学习—数值处理

如何使用Flask编写一个网站

Qml中的那些坑(七)---ComboBox嵌入Popup时，滚动内容超过其可见区域不会关闭ComboBox弹窗

鸿蒙NEXT开发案例：指尖轮盘

首页

博学

6Ren·AI

商城

c - 使用大量内存的堆实现 - C