作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试在一个小项目中使用 SuperFastHash,但我似乎无法理解为什么它为同一字符串提供不同的哈希值。仅当指针和字符串相同时,它才输出相同的哈希值。有任何想法吗?证明这一点的代码如下。
// SuperFastHash, taken from http://www.azillionmonkeys.com/qed/hash.html
#include <stdint.h>
#include <stdio.h>
#include <stdlib.h>
#undef get16bits
#if (defined(__GNUC__) && defined(__i386__)) || defined(__WATCOMC__) \
|| defined(_MSC_VER) || defined (__BORLANDC__) || defined (__TURBOC__)
#define get16bits(d) (*((const uint16_t *) (d)))
#endif
#if !defined (get16bits)
#define get16bits(d) ((((uint32_t)(((const uint8_t *)(d))[1])) << 8)\
+(uint32_t)(((const uint8_t *)(d))[0]) )
#endif
uint32_t SuperFastHash (const char * data, int len);
int main(void)
{
char* str = "a\0a";
printf("%s\n", &str[0]); // a
printf("%s\n", &str[2]); // a
printf("%i\n", SuperFastHash(&str[0], 25)); // -1120168156
printf("%i\n", SuperFastHash(&str[2], 25)); // -280310739
}
uint32_t SuperFastHash (const char * data, int len) {
uint32_t hash = len, tmp;
int rem;
if (len <= 0 || data == NULL) return 0;
rem = len & 3;
len >>= 2;
/* Main loop */
for (;len > 0; len--) {
hash += get16bits (data);
tmp = (get16bits (data+2) << 11) ^ hash;
hash = (hash << 16) ^ tmp;
data += 2*sizeof (uint16_t);
hash += hash >> 11;
}
/* Handle end cases */
switch (rem) {
case 3: hash += get16bits (data);
hash ^= hash << 16;
hash ^= ((signed char)data[sizeof (uint16_t)]) << 18;
hash += hash >> 11;
break;
case 2: hash += get16bits (data);
hash ^= hash << 11;
hash += hash >> 17;
break;
case 1: hash += (signed char)*data;
hash ^= hash << 10;
hash += hash >> 1;
}
/* Force "avalanching" of final 127 bits */
hash ^= hash << 3;
hash += hash >> 5;
hash ^= hash << 4;
hash += hash >> 17;
hash ^= hash << 25;
hash += hash >> 6;
return hash;
}
最佳答案
您的 len
参数 (25) 超出了可能应为 1 的字符串大小。char* str = "a\0a"
的内存布局为 { 'a', 0, 'a', 0 }
在这四个字符之后,它是未定义的,并且很可能不是相同值的 23 倍(这当然会导致相等的哈希值)。 SuperFastHash
函数忽略字符串终止符,它会计算您通过 len
参数定义的字符数量。
要查看该功能是否正常工作,请尝试以下示例:
#include <assert.h>
int main(void)
{
char *buf = "abc\0abc";
assert(SuperFastHash(&buf[0], 3) == SuperFastHash(&buf[4], 3));
// etc.
}
关于c - SuperFastHash 对同一字符串返回不同的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21740720/
我正在尝试在一个小项目中使用 SuperFastHash,但我似乎无法理解为什么它为同一字符串提供不同的哈希值。仅当指针和字符串相同时,它才输出相同的哈希值。有任何想法吗?证明这一点的代码如下。 //
所以,我的 SFH 函数: /* * Hash function (found at: 'http://www.azillionmonkeys.com/qed/hash.html') */ i
注意:我没有尝试使用 SuperFastHash并期望它给出与 CRC32 相同的输出值。 我正在写一个简单的 LZSS压缩/解压缩例程以提供非常快速的解压缩并且在解压缩时没有内存开销。输入数据被分成
我是一名优秀的程序员,十分优秀!