- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在编写一个 Haxe C# 目标,并且我一直在研究 Haxe 的标准库的性能差异,以便我们可以通过其跨平台代码提供最佳性能。
一个很好的例子是哈希表代码。我不太愿意使用 .NET 的字典,因为它看起来很笨重(除了它持有的不必要信息之外,由于内存对齐问题,键/值对的结构会占用大量内存),而且由于在 std 上库中没有对象哈希之类的东西,我真的认为我可以通过不必调用 GetHashCode 并一直内联它来压缩一点性能。
另外很明显,Dictionary 实现使用链表来处理冲突,这远非理想。
所以我们开始实现自己的解决方案,从 IntHash (Dictionary) 开始我们首先实现了Hopscotch hashing ,但结果确实不是很好,但很明显它不能很好地支持巨大的哈希表,因为 H 通常是一个机器字,并且随着 H/Length 的增加,性能越差。
然后我们跳转到实现 khash启发算法。这个有很大的潜力,因为它的基准测试令人印象深刻,并且它可以处理同一阵列上的冲突。它也有一些很棒的东西,比如调整大小而不需要两倍于我们需要的内存。
基准测试令人失望。当然,不用说我们的实现比 Dictionary 的内存使用要低得多。但我也希望能获得不错的性能提升,但不幸的是,事实并非如此。它并没有低于太远 - 不到一个数量级 - 但对于 set 和 get,.NET 的实现仍然表现更好。
所以我的问题是:这是我们拥有的最好的 C# 吗?我尝试寻找任何自定义解决方案,但似乎几乎没有。有那个 C5 泛型集合,但代码太乱了,我什至没有测试。而且我也没有找到基准。
那么……是吗?我应该环绕 Dictionary<>
吗? ?
最佳答案
我发现 .NET Dictionary
在大多数情况下表现良好,即使不是特别好。这是一个很好的通用实现。我最常遇到的问题是 2 GB 的限制。在 64 位系统上,您不能向字典中添加超过 8950 万个项目(当键是整数或引用,值是引用时)。字典开销似乎是每个项目 24 个字节。
这个限制以一种非常奇怪的方式为人所知。 Dictionary
似乎通过加倍增长——当它变满时,它会增加下一个至少是当前大小两倍的素数的容量。因此,字典将增长到大约 4700 万,然后抛出异常,因为当它试图加倍(到 9400 万)时,内存分配失败(由于 2 GB 的限制)。我通过预先分配 Dictionary
(即调用允许您指定容量的构造函数)来解决这个问题。这也加快了字典的填充速度,因为它永远不必增长,这需要分配一个新数组并重新散列所有内容。
是什么让您说 Dictionary
使用链表来解决冲突?我很确定它使用开放寻址,但我不知道它是如何进行探测的。我想如果它进行线性探测,那么效果类似于您使用链表获得的效果。
我们编写了自己的 BigDictionary
类来突破 2 GB 的限制,并发现使用线性探测的直接开放寻址方案可提供相当不错的性能。它不如 Dictionary
快,但它可以处理数亿个项目(如果我有内存的话可以处理数十亿个)。
也就是说,您应该能够编写一个更快的特定于任务的哈希表,它在某些情况下优于 .NET 字典。但对于通用哈希表,我认为您很难做得比 BCL 提供的更好。
关于c# - System.Collections.Generic.Dictionary = 终极性能?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4681526/
我正在用 Python (2.6) 编写一个应用程序,需要我使用字典作为数据存储。 我很好奇拥有一个大字典是否更节省内存,或者将其分解为许多(很多)较小的字典,然后拥有一个包含对所有较小字典的引用的“
Convert this [ "Cat" : ["A" : 1, "B": 2], "Mat" : ["C" : 3, "D": 4] ] Into [ "A" : 1,
有什么很酷的快速方法可以让两个字典创建第三个字典,以内连接方式将第一个字典的键映射到第二个字典的值? Dictionary dic1 = new Dictionary {{a1,b1},{a2,b2}
我希望将字典相互嵌套,以便容纳 block 的 xy 坐标。所以我会 IDictionary, IDictionary> 键 Dictionary 包含列、行组合,而值 Dictionary 包含 x
在 C# 中,我需要将数据保存在字典对象中,如下所示: Dictionary> MyDict = new Dictionary>(); 现在我意识到,在某些情况下我需要一些其他(不是字典类的)
第一个Dictionary就像 Dictionary ParentDict = new Dictionary(); ParentDict.Add("A_1", "1")
我似乎无法理解这个问题。我需要使用 LINQ 按内部字典的值对字典进行排序。有什么想法吗? 最佳答案 你的意思是你想要所有的值,按内部值排序? from outerPair in outer from
我想建模一个模式,其中响应是字典: { 'id1': { 'type': 'type1', 'active': true, }, 'id2': { 'type':
我有以下代码要添加或更新(如果已经存在)dict()-dict 中的值: if id not in self.steps: self.steps[ id ] = step else:
我有一个包含字典的 Swift 字典,我想使用存储的属性来访问键值: var json = [NSObject:AnyObject]() var title: String { get
我想创建一个 Dictionary>结构,我想提供一个 IEqualityComparer在包含 APerson 的second 字典中作为关键 如果我只有内部字典,那就是 var f = new D
我有一个集合,其中包含如下文档:文档 1: { "company": "ABC" "application": { "app-1": {"earning_from_src_A": 50,
我正在快速学习。 我发现 dictionary 就像 hash 用于 PHP 或其他一些语言。 那我怎么制作dictionary的dictionary呢?? 我有这样的数据 key:J name:jh
这个问题在这里已经有了答案: Explode a dict - Get all combinations of the values in a dictionary (2 个答案) 关闭 5 个月前
我是编程新手,所以如果我的问题看起来很愚蠢,我很抱歉。我想问一下有没有办法从 Multi.Dictionary 返回key当我有值(value)? 这是我的代码: Dim myDict Set myD
我试图找出标准 Ada 库是否配备了“字典”类型(我的意思是:一种以 格式存储值的数据结构,我可以从中检索 value 使用相应的唯一 key)。 这样的数据结构存在吗?如果是这样,有人可以提供一个
我究竟做错了什么?根据我的测试,objDic.exists 永远不会给出 False! dim objDic set objDic = createobject("scripting.
我想创建一个复合类型,其中包含一个字典作为其命名字段之一。但是明显的语法不起作用。我敢肯定有一些我不明白的基本原理。下面是一个例子: type myType x::Dict() end Jul
julia> hotcell2vocab = Dict([(cell, i-1+vocab_start) for (i,cell) in enumerate(h
我有一个简单的问题:我对 Dictionary.Value 集合进行了很多次迭代,这让我很烦,我必须调用 .ToList() 然后才能调用 .ForEach(),因为它似乎没有可枚举的Dictiona
我是一名优秀的程序员,十分优秀!