python - 在 Python 中计算/验证 bz2 (bzip2) CRC32-6ren

python - 在 Python 中计算/验证 bz2 (bzip2) CRC32

转载作者：太空狗更新时间：2023-10-30 00:15:32

24

4

我正在尝试计算/验证压缩的 bzip2 存档的 CRC32 校验和。

.magic:16                       = 'BZ' signature/magic number
.version:8                      = 'h' for Bzip2 ('H'uffman coding)
.hundred_k_blocksize:8          = '1'..'9' block-size 100 kB-900 kB

.compressed_magic:48            = 0x314159265359 (BCD (pi))
.crc:32                         = checksum for this block
...
... 
.eos_magic:48                   = 0x177245385090 (BCD sqrt(pi))
.crc:32                         = checksum for whole stream
.padding:0..7                   = align to whole byte

http://en.wikipedia.org/wiki/Bzip2

所以我知道 CRC 校验和在 bz2 文件中的位置，但我将如何验证它们。我应该binascii.crc32() 哪些 block 来获得两个 CRC？我已尝试逐字节计算各种 block 的 CRC，但未能找到匹配项。

谢谢。我将研究 bzip2 源代码和 bz2 Python 库代码，也许能找到一些东西，尤其是在 decompress() 方法中。

更新 1:

据我所知，区 block 头由以下标签标识。 但微小的 bz2 文件不包含 ENDMARK 文件。(感谢 adw，我们发现应该寻找 ENDMARK 的位移值，因为压缩数据未填充到字节。)

#define BLOCK_HEADER_HI  0x00003141UL
#define BLOCK_HEADER_LO  0x59265359UL

#define BLOCK_ENDMARK_HI 0x00001772UL
#define BLOCK_ENDMARK_LO 0x45385090UL

这来自 bzlib2recover.c 源代码， block 似乎总是从第 80 位开始，就在 CRC 校验和之前，应该从 CRC 计算中省略，因为不能对其进行 CRC 校验自己的 CRC 是相同的 CRC(你明白我的意思)。

searching for block boundaries ...
block 1 runs from 80 to 1182

查看计算这个的代码。

更新 2:

bzlib2recover.c 没有CRC计算功能，它只是从损坏的文件中复制CRC。但是，我确实设法在 Python 中复制了 block 计算器功能，以在 bz2 压缩文件中标出每个 block 的起始位和结束位。回到正轨，我发现 compress.c 引用了 bzlib_private.h 中的一些定义。

#define BZ_INITIALISE_CRC(crcVar) crcVar = 0xffffffffL;
#define BZ_FINALISE_CRC(crcVar) crcVar = ~(crcVar);
#define BZ_UPDATE_CRC(crcVar,cha)              \
{                                              \
   crcVar = (crcVar << 8) ^                    \
            BZ2_crc32Table[(crcVar >> 24) ^    \
                           ((UChar)cha)];      \
}

这些定义也被 bzlib.c 访问，s->blockCRC 在 bzlib.c 中初始化和更新，并在中完成压缩.c。有 2000 多行 C 代码，这将需要一些时间来查看并弄清楚哪些进入了哪些没有。我也在问题中添加了 C 标签。

顺便说一下，这里是 bzip2 的 C 源代码 http://www.bzip.org/1.0.6/bzip2-1.0.6.tar.gz

更新 3:

原来 bzlib2 block CRC32 是使用以下算法计算的:

dataIn是要编码的数据。

crcVar = 0xffffffff # Init
    for cha in list(dataIn):
        crcVar = crcVar & 0xffffffff # Unsigned
        crcVar = ((crcVar << 8) ^ (BZ2_crc32Table[(crcVar >> 24) ^ (ord(cha))]))

    return hex(~crcVar & 0xffffffff)[2:-1].upper()

其中BZ2_crc32Table定义在crctable.c

对于 dataIn = "justatest"，返回的 CRC 是 7948C8CB，用该数据压缩了一个文本文件，bz2 文件中的 crc:32 校验和是 79 48 c8 cb 这是一场比赛。

结论:

bzlib2 CRC32 是(引用 crctable.c)

Vaguely derived from code by Rob Warnock, in Section 51 of the comp.compression FAQ...

...因此，据我所知，无法使用标准 CRC32 校验和计算器进行预先计算/验证，而是需要 bz2lib 实现(bzlib_private.h 中的第 155-172 行)。

最佳答案

以下是bzip2使用的CRC算法，用Python编写:

crcVar = 0xffffffff # Init
    for cha in list(dataIn):
        crcVar = crcVar & 0xffffffff # Unsigned
        crcVar = ((crcVar << 8) ^ (BZ2_crc32Table[(crcVar >> 24) ^ (ord(cha))]))

    return hex(~crcVar & 0xffffffff)[2:-1].upper()

(C 代码定义可以在 bzlib_private.h 的第 155-172 行找到)

BZ2_crc32Table 数组/列表可以在 bzip2 源代码的 crctable.c 中找到。此 CRC 校验和算法引用:“..模糊地从 Rob Warnock 的代码中导出，在 comp.compression FAQ 的第 51 节中......”(crctable.c )

校验和是根据未压缩的数据计算的。

资源可以在这里下载:http://www.bzip.org/1.0.6/bzip2-1.0.6.tar.gz

关于python - 在 Python 中计算/验证 bz2 (bzip2) CRC32，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/4468605/

24

4

0

文章推荐： python - 使用 cython 将模块移植到 python 3.1

文章推荐： c# - LINQ.Any 到字符串的结果

文章推荐： c# - 正则表达式捕获大写和小写字母

文章推荐： python - 如何将数据重定向到 "getpass"之类的密码输入？

jsf - Bean 验证 VS JSF 验证
在 JSF2 应用程序中遇到验证属性的问题时，有两种主要方法。使用 Annotation 在 ManagedBean 上定义验证 @ManagedBean public class MyBean {
javascript - Jquery 验证。验证 "keyup"并在密码正确时隐藏表单
我想实现一个不常见的功能，我认为 jquery 验证插件将是最好的方法(如果您在没有插件的情况下建议和回答，我们也会欢迎)。我想在用户在输入字段中输入正确的单词后立即隐藏表单。我试过这个: $("
javascript - jQuery 验证 - 同一类的 NotEqual 验证
我有几个下拉菜单(类名为month_dropdown)，并且下拉菜单的数量不是恒定的。我怎样才能为它们实现 NotEqual 验证。我正在使用 jQuery 验证插件。这就是我写的 - jQuery
php - Javascript 中的 URL 验证 InstaGram 验证
我设法制作了这个网址验证代码并且它起作用了。但我面临着一个问题。我认为 stackoverflow 是获得解决方案的最佳场所。 function url_followers(){ var url=do
java - 验证/验证 Google Play 游戏服务 ID？
我目前正在使用后端服务，该服务允许用户在客户端应用程序上使用 Google Games 库登录。用户可以通过他们的 gplay ID 向我们发送信息，以便登录或恢复旧帐户。用户向我们发送以下内容，包
完整和部分 IP 的 python IP 验证 REGex 验证
我正在尝试验证输入以查看它是否是有效的 IP 地址(可能是部分地址)。可接受的输入:172、172.112、172.112.113、172.112.113.114 Not Acceptable 输入
regex - Mongoose 验证 : required : false, 验证 : regex, 问题与空值
我从 Mongoose 验证中得到这条消息: 'Validator failed for path phone with value ``' 这不应该发生，因为不需要电话。这是我的模型架构: var
openssl - 使用 .start_tls_s() 时如何强制 Python LDAP 验证/验证 SSL 证书
我一直在尝试使用Python-LDAP (版本 2.4.19)在 MacOS X 10.9.5 和 Python 2.7.9 下我想在调用 .start_tls_s() 后验证与给定 LDAP 服务
javascript - 在 VS 2017 中禁用一个项目的 ESLint/CSSLint/Javascript 验证/CSS 验证
我正在处理一个仅与 IE6 兼容的旧 javascript 项目(抱歉...)，我想仅在 VS 2017 中禁用此项目的 ESLint/CSLint/Javascript 验证/CSS 验证。我知道
spring - 使用 Hibernate Validator 验证 double 和 float 值 - bean 验证
我正在寻找一种方法来验证 Spring 命令 bean 中的 java.lang.Double 字段的最大值和最小值(一个值必须位于给定的值范围之间)，例如, public final class W
java - 无法执行目标org.apache.maven.plugins :maven-failsafe-plugin:2. 12:验证(验证)
我正在尝试在 springfuse(JavaEE 6 + Spring Framework (针对 Jetty、Tomcat、JBoss 等)) 和 maven 的帮助下构建我的 webapps 工作
Scalaz 验证
我试图在我们的项目中使用 scalaz 验证，但遇到了以下情况: def rate(username: String, params: Map[String, String]): Validation
YamlLint 验证
我有一个像这样的 Yaml 文件 name: hhh_aaa_bbb arguments: - !argument name: inputsss des
JavaScript 验证
我有一个表单，人们可以单击并向表单添加字段，并且我需要让它在单击时验证这些字段中的值。假设我单击它两次并获取 2 个独立的字段集，我需要旋转 % 以确保它在保存时等于 100。我已放入此函数以使其
JavaScript 验证
在我的页面中有一个选项可以创建新的日期字段输入框。用户可以根据需要创建尽可能多的“截止日期”和“起始日期”框。就像，日期_to1 || date_from1 日期到2 ||日期_from2 date
YamlLint 验证
我有一个像这样的 Yaml 文件 name: hhh_aaa_bbb arguments: - !argument name: inputsss des
Jquery 验证
有没有办法在动态字段上使用 jquery 验证表单。我想将其设置为必填字段我正在使用 Jsp 动态创建表单字段。喜欢等等...... 我想使用必需的表单字段验证此表单字段。最佳答
JavaScript 验证
嗨，任何人都可以通过提供 JavaScript 代码来帮助我验证用户名文本框不应包含数字，它只能包含一个字符。最佳答案使用正则表达式: (\d)+ 如果找到匹配项，则字符串中就有一个数字。关于J
JavaScript 验证
我有两个输入字段holidayDate和Description(id=tags) $(document).ready(function() {
JavaScript 验证 :
我遇到了这个问题，这些验证从电子邮件验证部分开始就停止工作。我只是不明白为什么即使经过几天的观察，只是想知道是否有人可以在这里指出我的错误？ Javascript部分: function valid

首页

博学

6Ren·AI

商城

python - 在 Python 中计算/验证 bz2 (bzip2) CRC32