gpt4 book ai didi

c# - 我的课怎么占用这么多内存空间?

转载 作者:太空狗 更新时间:2023-10-29 19:49:28 25 4
gpt4 key购买 nike

我将有数千万个 MyClass 类的实例,并希望最小化其内存大小。 Find out the size of a .net object 中讨论了测量对象在内存中占用多少空间的问题。我决定听从 Jon Skeet 的建议,这是我的代码:

   // Edit: This line is "dangerous and foolish" :-) 
// (However, commenting it does not change the result)
// [StructLayout(LayoutKind.Sequential, Pack = 1)]
public class MyClass
{
public bool isit;
public MyClass nextRight;
public MyClass nextDown;
}

class Program
{
static void Main(string[] args)
{
var a1 = new MyClass(); //to prevent JIT code mangling the result (Skeet)
var before = GC.GetTotalMemory(true);
MyClass[] arr = new MyClass[10000];
for (int i = 0; i < 10000; i++)
arr[i] = new MyClass();

var after = GC.GetTotalMemory(true);

var per = (after - before) / 10000.0;
Console.WriteLine("Before: {0} After: {1} Per: {2}", before, after, per);
Console.ReadLine();
}
}

我在 64 位 Windows 上运行程序,选择“release”,平台目标:“any cpu”,然后选择“optimize code”(选项仅在我明确定位 x86 时才重要)结果很遗憾,48 字节每个实例。

我的计算是每个引用 8 个字节,再加上 1 个 bool 字节加上大约 8 个字节的开销。到底是怎么回事?这是保持 RAM 价格高和/或让非 Microsoft 代码膨胀的阴谋吗?好吧,我想我真正的问题是:我做错了什么,或者我怎样才能最小化 MyClass 的大小?

编辑:我为我的问题草率道歉,我编辑了几个标识符名称。我的具体和直接关注是构建一个“二维链表”作为稀疏 bool 矩阵实现,我可以在其中轻松地获得给定行/列中设置值的枚举。 [当然这意味着我还必须在类上存储 x,y 坐标,这使我的想法更不可行]

最佳答案

从另一端着手解决问题。而不是问自己“我怎样才能使这个数据结构更小并且仍然分配了数千万个?”问问自己“我怎样才能使用更紧凑的完全不同的数据结构来表示这些数据?”

看起来您正在构建一个双向链接的 bool 列表,正如您所注意到的,它使用的内存比它需要的内存多 30 到 50 倍。为什么你不简单地使用 BitArray 有什么原因吗?存储您的 bool 值列表?

更新:

in fact I was trying to implement a sparse boolean two-dimensional matrix

那你为什么不一开始就说呢?

当我想制作一个巨大的稀疏 bool 二维矩阵时,我构建了一个带有内存工厂的不可变持久 bool 四叉树。如果数组是稀疏的,或者即使它是密集的但在某种程度上是自相似的,您也可以实现巨大压缩。 264 x 264 bool 值的方形数组很容易表示,即使显然作为一个真正的数组,这将比世界上存在的内存更多。

我一直在考虑就此技术撰写一系列博客文章;我可能会在三月下旬这样做。 (更新:那篇文章不是我在 2012 年 3 月写的;我是在 2020 年 8 月写的。https://ericlippert.com/2020/08/17/life-part-32/)

简而言之,这个想法是创建一个抽象类 Quad,它有两个子类:Single 和 Multi。 “Single”是双例——类似于单例,但恰好有两个实例,称为 True 和 False。 Multi 是具有四个子 quad 的 Quad,分别称为 NorthEast、SouthEast、SouthWest 和 NorthWest。

每个 Quad 都有一个整数“level”; Single 的级别为零,并且需要 n 级的 multi 才能使其所有子级都是 n-1 级的 Quads。

多工厂被内存;当你要求它制作一个有四个 child 的新 Multi 时,它会查询缓存以查看它之前是否制作过。如果有,它不会构造一个新的;它递出旧的。由于 Quad 是不可变的,因此您不必担心有人会在 Quad 在缓存中后更改您的 Quad。

现在考虑有多少内存字(一个字是 4 或 8 个字节,具体取决于体系结构)n 级的“全假”Multi 消耗了多少。一个级别 1 的“全假”multi 使用四个词来链接到它的子级,一个词用于级别计数(如果需要;你不需要在 multi 中保留级别,尽管它有助于调试)和几个词对于同步块(synchronized block)等。暂且称它为八个字吧。 (加上 False Single quad 的内存,我们可以假设它是一个恒定的两个或三个单词,因此可以忽略。)

2 级“全假”多词使用相同的八个单词,但它的四个子词中的每一个都是相同的 1 级多词。因此,2 级“全假”多重的总消耗假设为 16 个单词。

对于 3 级、4 级……等也是如此。逻辑上是 264 x 264 bool 方形数组的 64 级多重的总内存消耗仅为 64 x 16 内存字!

有道理吗?希望这足以让你继续下去。如果没有,请查看我上面的博客链接。

关于c# - 我的课怎么占用这么多内存空间?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8897753/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com