- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
注意:我没有尝试使用 SuperFastHash并期望它给出与 CRC32 相同的输出值。
我正在写一个简单的 LZSS压缩/解压缩例程以提供非常快速的解压缩并且在解压缩时没有内存开销。输入数据被分成 4096 字节长的 block ,并按顺序压缩。
我的问题:我想为每个压缩 block ( block 大小 <= 4096 字节)添加一些错误检测。时间限制非常严格,因此校验和例程必须非常快。我避免使用密码算法(MD5、SHA1),因为它们涉及大量计算,我选择了 CRC32(一种更简单、明显的算法)。
经过一些测试后,我发现 CRC32 对于我的项目限制来说太慢了。我使用了来自 here 的 enwik9(维基百科的 10^9 字节文本转储) .我使用我的 LZSS 例程压缩它并获得了一个 570Mb 的文件。我测量了以下持续时间(单线程、磁盘 IO 除外、所有数据在处理前加载到内存中、10 次试验的平均值):
| Operation | Time (GCC4.4.5/Linux) | Time (MSVC2010/Win7) ||-------------------------------+--------------------------+------------------------|| Decompression | 6.8 seconds | 6.95 seconds || CRC32 on decompressed result | 4.9 seconds | 4.62 seconds || CRC32 on compressed result | 2.8 seconds | 2.69 seconds |
Then I tested SuperFastHash, just by curiosity :
| Operation | Time (GCC4.4.5/Linux) | Time (MSVC2010/Win7) ||-------------------------------+--------------------------+------------------------|| SFH on decompressed result | 1.1 seconds | 1.33 seconds || SFH on compressed result | 0.7 seconds | 0.75 seconds |
And here is my CRC32 implementation (I followed the descriptions from the following document : http://www.ross.net/crc/download/crc_v3.txt) :
# include <stdint.h>
// CRC32 lookup table (corresponding to the polynom 0x04C11DB7)
static const uint32_t crc32_lookup_table[256] =
{
0x00000000, 0x77073096, 0xEE0E612C, 0x990951BA,
0x076DC419, 0x706AF48F, 0xE963A535, 0x9E6495A3,
0x0EDB8832, 0x79DCB8A4, 0xE0D5E91E, 0x97D2D988,
// many lines skipped
// ...
0xB40BBE37, 0xC30C8EA1, 0x5A05DF1B, 0x2D02EF8D
} ;
uint32_t crc32_hash(const uint8_t * data, size_t len)
{
uint32_t crc32_register = 0xFFFFFFFF ;
while( len-- )
{
crc32_register = (crc32_register >> 8)
^ crc32_lookup_table[(crc32_register & 0x000000FF) ^ *data++] ;
}
return crc32_register ^ 0xFFFFFFFF ;
}
我的问题是:
我可以使用散列而不是循环冗余校验值来对压缩数据 block 进行错误检测吗?据我所知(我从我的电子类(class)中记得),CRC 算法被设计为当数据通过嘈杂的 channel 传输时突发错误时非常有效,这不是从硬盘读取数据的情况。如果我错了,请纠正我。
谢谢你的建议!
最佳答案
已发现 SuperFastHash 以及其他快速散列函数 murmur2 存在一些问题。如果您正在寻找适合更大数据 block 且冲突更少的东西,您可以尝试使用 128 位的 google 城市哈希 (http://code.google.com/p/cityhash/) 变体或 murmur3。还有一些更离谱的函数,如 crap8 和 crapwow,它们声称提供几乎完美的位雪崩和漏斗,因此碰撞几乎为零,您可以在此处阅读它和其他非加密哈希函数:http://www.team5150.com/~andrew/noncryptohashzoo/
关于c - 使用 SuperFastHash 而不是 CRC32?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7312487/
我已经搜索过,但无法找到有关它是什么以及如何计算的信息。 我不知道为什么这个问题被否决了。不是说清楚和编程有关吗?或者我应该问: # Or you can compute the running CR
如果我有一定数量的字节要串行传输,我如何确定使用哪个 CRC(CRC8、CRC16 等,基本上是多少位的 CRC?)并且错误检测百分比仍然很高?有这个公式吗? 最佳答案 从 CRC 长度的角度来看,适
这个问题在这里已经有了答案: Incremental Checksums (3 个答案) 关闭 8 年前。 如果我有子串 S0, S1, ... Sn 计算出的 CRCs C0, C1, ... C
我知道 CRC 是一个线性函数,这意味着 CRC(x xor y) = CRC(x) xor CRC(y),但我不知道如何证明 CRC 的这个属性。 有谁有想法吗? 非常感谢! 最佳答案 这通常不是真
我知道使用 CRC 的全部目的是进行错误检测,但我听说有人说除了错误检测之外,它还可以用来进行基本的错误纠正。我很好奇是否是这样,如果是这样,它有多强大?我的意思是,我们通常将 CRC 称为能够执行
我见过 8 位、16 位和 32 位 CRC。 在什么时候我需要跳转到更广泛的 CRC? 我的直觉 react 是它基于数据长度: 1-100 字节:8 位 CRC 101 - 1000 字节:16
我正在学习 CRC,搜索引擎和 SO 对此一无所知...... 为什么我们有“正态”、“逆向”和“倒数”多项式?是喜欢 Big Endian、Little Endian 还是其他什么? 最佳答案 CR
在学习计算机网络类(class)时,教授谈到了示例代码中两个有效代码字之间的汉明距离。我已经阅读了有关汉明距离的信息,从告诉 2 个字符串之间的差异距离的角度来看,这是有道理的。例如: Code Wo
我从Wikipedia知道CRC计算算法。关于RAR文件的结构我读过here 。例如有这样写: The file has the magic number of: 0x 52 61 72 21
我已经阅读了 CCITT 和 TI 关于 msp430 的文档。是否可以使用任何内置函数计算 MSP430F5438A 的 CRC?或者我是否必须为每个获取的数据计算 CRC。 最佳答案 可以使用软件
我尝试修改现有项目的 CRC 模块。目前它使用 CRC-16-CCITT。从代码中我知道它的多项式是0x11021,它的CRC-Table是: static const unsigned sh
使用线性反馈移位寄存器(LFSR)实现CRC生成有两种方法,如图所示。图中生成多项式的系数为100111,红色“+”圆圈为异或运算符。两者的初始化寄存器值都是 00000。 例如,如果输入数据比特流是
当数据长度不是4的倍数时,有没有办法通过表驱动的方式加快CRC校验过程?在我的问题中,有 226 位需要检查,并通过 CRC24Q 算法为此计算了 24 位校验和。 最佳答案 使用表格计算第一部分的c
我需要计算消息的 CRC 并将其放在该消息的开头,以便带有“前置”补丁字节的消息的最终 CRC 等于 0。我能够做到这在几篇文章的帮助下非常容易,但不适用于我的特定参数。问题是我必须使用给定的 CRC
我正在将一些从我自己的类中定义的对象保存到文件中。 (保存流数据)。 这一切都很好,但我希望能够在文件中存储该文件的 CRC 校验和。 然后,每当我的应用程序尝试打开文件时,它都可以读取内部存储的 C
我有一组受 16 位校验和保护的数据,需要更正。校验和位置是已知的,计算它们的确切区域以及用于计算它们的确切算法却未知。 16 位,最低有效位在前。我怀疑这是某种 16 位 CRC,但我无法找到实际计
我想使用Nucleo L053R8的crc计算单元计算3字节的CRC值。生成多项式如下:g(X)=x^24 + x^10 + x^9 + x^6 + x^4 + x^3 + x + 1 看来使用这个C
开始之前:我绝对是 JAVA 的初学者。我一直是一名 C++ 程序员。所以当我在这里做傻事时请告诉我! 我正在查询一个巨大的数据库并将该数据直接导出到一个 zip 文件中。我们在这里讨论的是 35GB
我有一些 C++ 代码,我正在将其移植到 C。当我在 C 代码中计算 CRC 时,出于某种原因,它返回错误的 CRC 值,而 C++ 代码运行良好。我是 C++ 的新手。我需要一些帮助来理解我在返回错
我有两个来源来计算看似相同的 crc 值。我不明白为什么“boost/crc.hpp”实现与“linux/lib/crc-ccitt.c”实现不同。 crc-ccitt.c boost 这是一个说明问
我是一名优秀的程序员,十分优秀!