- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
如果我们有以下优先级(按此顺序),最好的哈希算法是什么:
它不一定是安全的。基本上我试图根据某些对象的属性组合创建索引。 所有属性都是字符串。
任何对 c# 实现的引用都将不胜感激。
最佳答案
忘掉“最好”这个词吧。无论任何人可能想出哪种散列算法,除非您需要散列的数据集非常有限,否则如果仅提供正确的(或从您的角度来看),则平均表现非常好的每个算法都可能变得完全无用“错误”)数据。
与其浪费太多时间考虑如何在不使用太多 CPU 时间的情况下使散列更无冲突,我宁愿开始考虑“如何减少冲突问题”。例如。如果每个散列桶实际上是一个表,并且该表中的所有字符串(发生冲突)都按字母顺序排序,您可以使用二进制搜索(仅 O(log n))在桶表中进行搜索,这意味着,即使当每第二个哈希桶有 4 次冲突时,您的代码仍将具有不错的性能(与无冲突表相比,它会慢一点,但不会慢那么多)。这里的一大优势是,如果您的表足够大并且您的散列不太简单,则导致相同散列值的两个字符串通常看起来完全不同(因此二分查找可以在平均一两个字符后停止比较字符串; 使每次比较都非常快)。
实际上,我自己之前遇到过这样一种情况,即使用二进制搜索直接在排序表中进行搜索比散列法更快!尽管我的哈希算法很简单,但对这些值进行哈希处理还是花费了相当多的时间。性能测试表明,只有当我获得超过 700-800 个条目时,散列确实比二进制搜索更快。然而,由于该表无论如何都不会增长到超过 256 个条目,并且平均表低于 10 个条目,基准测试清楚地表明在每个系统、每个 CPU 上,二进制搜索都更快。在这里,通常已经比较数据的第一个字节的事实足以导致下一个 bsearch 迭代(因为过去的数据在第一个到两个字节中已经非常不同)被证明是一个很大的优势。
所以总结一下:我会采用一个体面的哈希算法,它平均不会导致太多的冲突并且速度相当快(我什至会接受更多的冲突,如果它非常快的话!)并且宁愿优化我的代码如何在确实发生冲突后获得最小的性能损失(它们会发生!它们会发生,除非您的哈希空间至少等于或大于您的数据空间,并且您可以将唯一的哈希值映射到每个可能的数据集)。
关于c# - 在哈希冲突和字符串性能方面的最佳哈希算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/251346/
我的工作是将每条记录写入 Hadoop 映射中的 DynamoDB。 我无法使用具有 httpclient-4.2.5.jar 和 httpcore-4.2.5.jar 的 Hadoop 2.6 运行
我在 JavaScript 中嵌套了循环开关,例如: for (var i = 0; i < checkBoxIds.length; i++) { if ($('#' + checkB
我有一个文件夹被重命名的分支。现在我正在尝试合并从主干到这个分支的更改,但是在主干中修改的文件仍然在原始文件夹名称下,因此 svn 引发了树冲突。我该如何解决这个问题? 该文件夹已使用 svn ren
我在使用 jquery 暴露插件和 Masked 输入插件时遇到了问题。问题是它们都占用 $.mask 函数,从而导致冲突。但我非常需要这两个插件一起工作。我会将其中一个中的 $.mask 重命名为.
我正在尝试为我所有的 INPUT 元素做一个简单的 :focus 效果,就像这样: INPUT:focus { border-color: orange; } 这很好用,直到我将这段 CSS 添加到样
我是 javascript 的新手。 在 wordpress 上工作,我在自定义 js 中为我的主题输入了以下函数: document.getElementsByName("empty_cart")[
为什么有些 javascript 会与其他的发生冲突?我的意思是我一直在为图片库使用 javascript 代码,然后尝试在 jquery 中获取文本水印。为什么在使用 jquery 之后,画廊完全消
是否可以根据已知的输入值创建 MD5 碰撞? 所以例如我有输入字符串 abc与 MD5 900150983cd24fb0d6963f7d28e17f72 . 现在我想将字节添加到字符串 def获得相同
我在我的项目中使用原型(prototype): NodeParser.prototype.getChildren = function(parentContainer) { return fl
根据我对 merge 冲突的理解,当两个人更改了同一文件和/或修改了该文件中的同一行时,就会发生 merge 冲突。所以当我做一个 git pull origin master 我期望 merge 冲
iPad 上 Mobile Safari 中的 HTML5 模板。带 iScroll 的 Div 工作正常。 if/else 语句中还包含一个 jQuery 函数。该函数测试用户是否在 iScroll
我一直在尝试使 2 个脚本(1 个 mootol 和 1 个 jquery)在同一页面上工作,但没有成功。我一直在研究许多论坛等,但我仍然无法使这两个脚本同时工作。 这就是它在我的标题中的样子: /w
我想克隆带标题的问号。一切正常,但是当我将鼠标悬停在新问号上时,第一个问号上会出现工具提示。有什么想法吗? 我正在使用 jQuery 和醉酒的工具提示。 Demo here click here
好吧,我已经在一个 friend 的网站上工作了一段时间了。我的编码技能......值得怀疑,而且我遇到了很多问题。 目前我网站上的 jQuery 停止工作了,我找不到原因,并且我已尽一切努力让它工作
我想使用一个文件来保存所有#define 和常量:示例 #ifndef CONSTANTS_H_ #define CONSTANTS_H_ #include //OVERALL DEFS
我在我的表单中的所有 HTML 下都有一些验证码,这似乎阻止了我的复选框验证码的工作,一旦我在我的 HTML 下的代码周围添加/* */(使其不活动),我就得出了这个结论) 复选框验证代码开始正常工作
我是新手。我的页面上有两个 javascript/jquery。如果我使用第一个脚本,第二个脚本将不起作用。如果我删除第一个脚本,第二个脚本就可以正常工作。我不知道如何解决这个问题。我知道有一个“无冲
我是 Bison 新手,在处理 Shift/Reduce 冲突时遇到了麻烦... 我正在为C语言编写语法规则:ID是标识变量的标记,我编写此规则是为了确保即使将标识符写在括号中,也可以考虑它。 id
我目前正在使用 LibGdx 开发我的第一个 Android 游戏项目。这是一款 2D 迷宫游戏,您可以使用触摸输入从其中一个入口到其中一个导出“画出”一条线。世界本身是一个 TiledMap,目前仅
我正在尝试通过 javascript 完成表单验证,并在 #form# 标记中放置一个要执行的 .py 文件操作。但问题是,当我提交数据后,它不会重定向到 .py 操作。所以我摆脱了 preventd
我是一名优秀的程序员,十分优秀!