- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我需要一个非常快的通用哈希函数来处理 128 位 key 。返回的值需要大约 32 位(嗯,16 位就足够了;在大多数情况下,我实际上只需要 1-4 位)。
通用哈希意味着,有两个参数:key(128位)和index(64位)。对于两个键,如果使用不同的索引调用通用哈希函数,最终需要返回不同的结果。因此,对于不同的索引,通用哈希的行为应该类似于不同的哈希函数。对于 x = universalHash(k, i)
和 y = universalHash(k, i + 1)
,最好是所有位中平均有 50% 是不同的x 和 y(随机)。如果使用不同的键调用该方法,情况也是如此。实际上,5% 的折扣对我来说还可以。
它需要非常快(最多一到两次乘法)。它被调用了数百万次。请不要说:不,您不需要它太快。它最终也需要返回不同的值。
到目前为止我所拥有的(Java代码,但C是(由于缺乏128位数据类型,关键是a和b的组合,它们都是64位):
int universalHash(long a, long b, long index) {
long x = a ^ Long.rotateLeft(b, (int) index) ^ index;
int y = (int) ((x >>> 32) ^ x);
y = ((y >>> 16) ^ y) * 0x45d9f3b;
y = ((y >>> 16) ^ y) * 0x45d9f3b;
y = (y >>> 16) ^ y;
return y;
}
int universalHash2(long a, long b, long index) {
long x = Long.rotateLeft(a, (int) index) ^
Long.rotateRight(b, (int) index) ^ index;
x = (x ^ (x >>> 32)) * 0xbf58476d1ce4e5b9L;
return (int) ((x >>> 32) ^ x);
}
(第二种方法实际上对于某些值来说是错误的。)
我希望有一个比上面的散列函数更快的散列函数,并且保证在所有情况下都能工作(如果可能的话可以证明是正确的,即使这不是一个严格的要求;但是它不需要是加密安全的) )。
我将为相同的键调用带有递增索引(第一个索引 0,然后索引 1,依此类推)的 universalHash 方法。如果可以根据前一个结果更快地计算出下一个结果(例如,无需相乘),那就最好了。但如果索引是某个值(如示例代码中所示),我还需要快速“直接访问”。
背景
我试图解决的问题是为相对较小的一组键(通过直接映射最多 16 个键,通过分成更小的子集最多约 1024 个键)找到 MPHF(最小完美哈希函数)。算法详情参见我的MinPerf project ,特别是 RecSplit algorithm 。为了支持大小为 10^12 的集合(例如 BBHash ),我尝试在内部使用 128 位签名,这将简化算法。
最佳答案
您需要一个为 128 位输入输出 32 位的哈希函数。
一种简单的方法是只返回原始 128 位中的“一些”32 位。选择32位的方法有很多种,每种选择都会产生冲突。但索引可以决定选择哪一个32位。
128/32 = 4,因此 4 个索引足以找到至少一个不同的位。
C 实现是
uint32_t universal_hash(uint64_t key_higher, uint64_t key_lower, int index) {
// For a lack of portable 128 bit datatype we take the key in parts.
return 0xFFFFFFFF & ( index >=2 ? key_higher >> ((index - 2)*32) : key_lower >> (index*32));
}
关于java - 适用于 128 位 key 的非常快速的通用哈希函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46935380/
我使用 AppFuse 创建项目已经有一段时间了。我已经知道有两种方法可以开发 DAO 和 Manager 类: GenericDao/GenericManager 方法 UniversalDao/U
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
在普通的单线程程序中,捕获异常只需要通过try ... catch ... finally ...代码块就可以了。那么,在并发情况下,比如在父线程中启动了子线程,如何在父线程中捕获来自子线程的异常,
假设我有一个这样的界面 interface Example { first_name: string, last_name: string, home_town: string
我已经成为 hg 用户几年了,对此我很高兴! 我必须开始一个我以前从未做过的项目。我们的想法是开发一个具有批处理模式和 GUI 的软件。 因此,批处理模式和 GUI 模式都有共同的源,但每种模式也都包
我可以在Silverlight中使用generic.xaml来设置应用程序中所有TextBlock的样式吗? 我原以为它会起作用,但它没
顶部 map 有 3 个子 map ,每个子 map 都有不同的对象。 像下面的代码,如何将通用添加到 map 顶部? Map top = new ConcurrentHashMap();
我想创建一个hashmap,其中键是接口(interface)A,值是接口(interface)B。然后我想用实现A和B的类来初始化它。是否可以使用java泛型来做到这一点? 也就是说,我想要类似的东
Enum 位于 java.lang.Enum 中,Object 位于 java.lang.Object 中>。那么,为什么 Enum 不是 Object 呢? (我收到一个java.lang.Clas
我有一种方法,check,它有两个 HashMap 作为参数。这些映射的键是 String,值是 String 或 Arraylist。 哪个是更好的解决方案: public static boole
我启动了针对iPhone的应用程序,现在我也想将其应用程序用于iPad。当我开始做iPhone项目时,即使我添加了iPad xib,它也无法正确显示,如何转换我的项目同时适用于iPhone和iPad(
这行代码(代码1)有什么区别 auto l1 = [](auto a) { static int l = 0; std::cout operator() for type const char*) 被
使用 Generic#to,我可以获得 case class 的 HList 表示: import shapeless._ case class F(x: Int, y: String) scala>
我有一个 BiDiMap 类。如何使其通用,不仅接受 String 而且接受 Object 类型的对象作为输入参数,同时保持所有原始函数正常工作。例如,我希望能够使用函数 put() 和 Object
我在编译 foreach 循环时遇到问题。我很确定这是我的泛型处理的问题,因为该错误是对象兼容性问题。我已搜索解决方案,但找不到任何可以解决该问题的内容。 这是定义 Iterable adjList
大约有 6 个 POJO 类(域实体、DTO、DMO)都具有几乎相同的字段。为了从一个对象转换为另一个对象,我传递一个对象并调用它的 getter 将其设置到另一个对象中。 private UserT
有没有什么方法可以创建一个通用的 for 循环,它可以正确地循环遍历数组或对象?我知道我可以编写以下 for 循环,但它也会遍历将添加到数组的其他属性。 for (item in x) { co
我已经有一段时间没有写js了,显然有点生疏了。试图理解以下问题。 getCurrentPosition successCallback 中的警报正确显示纬度,但最后一行警报未定义。为什么我的 clie
请帮助我,我从来没有用 xib 为 iPhone/iPad 制作过通用的 UIViewControllers。如何使用 .m 和 .h 文件以及 _iphone.xib 和 _ipad.xib 创建类
我正在尝试创建一个 createRequest 函数,我可以将其重新用于我的所有网络调用,有些需要发布 JSON 而其他则不需要,所以我正在考虑创建一个采用可选通用对象的函数;理论上是这样的: str
我是一名优秀的程序员,十分优秀!