- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在理解 Deflate 算法时遇到困难 ( RFC 1951 )。
TL; DR如何解析Deflate压缩 block 4be4 0200
?
我创建了一个包含字母和换行符 a\n
的文件,并运行 gzip a.txt
。结果文件a.txt.gz
:
1f8b 0808 fe8b eb55 0003 612e 7478 7400
4be4 0200
07a1 eadd 0200 0000
我知道第一行是带有附加信息的标题,最后一行是 CRC32 加上输入的大小( RFC 1951 )。这两个对我来说没有任何麻烦。
但是我如何解释压缩 block 本身(中间线)?
这是它的十六进制和二进制表示:
4be4 0200
0100 1011
1110 0100
0000 0010
0000 0000
据我了解,不知何故这些:
Each block of compressed data begins with 3 header bits containing the following data:
- first bit BFINAL
- next 2 bits BTYPE
...实际上结束于第一个字节的末尾:0100 1011。 (我将跳过这个问题,为什么有人将实际上位于其他内容尾部的东西称为“标题”。)
据我所知,RFC 包含一些内容,应该是对此的解释:
- Data elements are packed into bytes in order ofincreasing bit number within the byte, i.e., startingwith the least-significant bit of the byte.
- Data elements other than Huffman codes are packedstarting with the least-significant bit of the dataelement.
- Huffman codes are packed starting with the most-significant bit of the code.
In other words, if one were to print out the compressed data asa sequence of bytes, starting with the first byte at theright margin and proceeding to the left, with the most-significant bit of each byte on the left as usual, one would beable to parse the result from right to left, with fixed-widthelements in the correct MSB-to-LSB order and Huffman codes inbit-reversed order (i.e., with the first bit of the code in therelative LSB position).
但遗憾的是我不明白这个解释。
返回我的数据。 OK,那么BFINAL就设置好了,那么BTYPE又是什么呢? 10 还是 01?
如何解释该压缩 block 中的其余数据?
最佳答案
首先让我们看看压缩数据的十六进制表示形式为一系列字节(而不是您问题中的一系列 16 位大端值):
4b e4 02 00
现在让我们将这些十六进制字节转换为二进制:
01001011 11100100 00000010 000000000
根据 RFC,这些位是“从字节的最低有效位开始”打包的。字节的最低有效位是该字节的最右边的位。所以第一个字节的第一位是这个:
01001011 11100100 00000010 000000000
^
first bit
第二位是这个:
01001011 11100100 00000010 000000000
^
second bit
第三位:
01001011 11100100 00000010 000000000
^
third bit
等等。一旦您检查了第一个字节中的所有位,您就可以从第二个字节的最低有效位开始。所以第九位就是这个:
01001011 11100100 00000010 000000000
^
ninth bit
最后一位,即三十秒位,是这样的:
01001011 11100100 00000010 000000000
^
last bit
BFINAL 值是压缩数据中的第一位,因此包含在上面标记为“第一位”的单个位中。它的值为1,表示这是压缩数据的最后一个 block 。
BTYPE 值存储在数据的接下来两位中。这些是上面标记为“第二位”和“第三位”的位。唯一的问题是两者中哪一位是最低有效位,哪一位是最高有效位。根据 RFC,“霍夫曼代码以外的数据元素被打包从数据元素的最低有效位开始。”这意味着这两个位中的第一个,即标记为“第二位”的位,是最低有效位。这意味着 BTYPE 的值为 01
为二进制。因此表示该 block 是使用固定霍夫曼码压缩的。
这就是最容易完成的部分。解码压缩 block 的其余部分更加困难(并且对于更现实的示例,更加困难)。正确解释如何做到这一点将使这个答案对于本网站来说太长(并且您的问题太宽泛)。不过,我会给你一个提示,数据中接下来的三个元素是霍夫曼代码 10010001('a')、00111010('\n')和 0000000(流结束)。剩余的 6 位未使用,并且不是压缩数据的一部分。
请注意,要了解如何解码 deflate 压缩数据,您必须了解什么 Huffman codes是。您正在遵循的 RFC 假设您这样做。您还应该知道如何LZ77 compression有效,尽管该文档或多或少解释了您需要了解的内容。
关于unix - Deflate压缩 block 的结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32419086/
我的 blockly.js 文件中有以下代码 Blockly.Blocks['account_number'] = { // Other type. init: function() {
首先抱歉我的英语不好,我正在开发 Image Splitter 应用程序并且已经完成,但是现在的要求是当图像被分割(分成几 block /chunks)那么图像 block 的每一 block (ch
#value: 消息的返回值,当发送到一个 block 时,是该 block 中最后一句话的值。所以 [ 1 + 2. 3 + 4. ] value 计算结果为 7。我发现有时很难使用。有没有办法显式
我想构建一个包含 3 div 的响应式导航栏相同的 width和 height . 我申请了 inline-block到每个 block ,我得到一个我不理解的行为。 问题是,第三 block 由 2
我希望使用 Blockly 来允许非技术人员用户指定测试脚本。 它的一部分需要一个文件选择器,但是,我看不到 Blockly 有一个。是吗? 实际上,我找不到完整的标准 block 列表。谁有网址?
仅当您位于父 block 内部时,父 block 的 props.isSelected 才为 true,但当您在该 block 的 innerBlocks 内进行编辑时则不然。 如何从父 block
仅当您位于父 block 内部时,父 block 的 props.isSelected 才为 true,但当您在该 block 的 innerBlocks 内进行编辑时则不然。 如何从父 block
我想创建一个具有不同背景颜色 block 和不同悬停颜色 block 的导航栏 block 。我可以分别创建不同的悬停颜色 block 或不同的背景颜色 block ,但不能一起创建。所以请告诉我如何
我正在使用看到的代码 here定期执行代码: #define DELAY_IN_MS 1000 __block dispatch_time_t next = dispatch_time(DISPATC
为什么 block 必须被复制而不是保留?两者在引擎盖下有什么区别?在什么情况下不需要复制 block (如果有)? 最佳答案 通常,当您分配一个类的实例时,它会进入堆并一直存在,直到它被释放。但是,
我想弄清楚我这样做是否正确: 如果我有一个 block ,我会这样做: __weak MyClass *weakSelf = self; [self performBlock:^{
我想制作一个 4 block 导航菜单,虽然我已经显示了一个 block ,然后单击打开第二个 block ,从第二个开始选择并再次单击出现第三个 block ,第四个 block 相同...这是我的
例如,这样更好吗? try { synchronized (bean) { // Write something } } catch (Int
我想让一只乌龟检查前方小块的颜色并决定移动到哪里。如果前面的补丁不是白色的,那么乌龟向左或向右旋转并移动。我的 If 决策结构中出现错误,显示“此处应为 TRUE?FALSE,而不是 block 列表
我想创建一个 block 对角矩阵,其中对角 block 重复一定次数,非对角 block 都是零矩阵。例如,假设我们从一个矩阵开始: > diag.matrix [,1] [,2] [
我是区 block 链新手。突然我有一个问题,我们是否可以通过区 block 号来访问以太坊区 block 链上之前的区 block 数据。 例如我创建了一个block1、block2。 block
我是区 block 链新手。突然我有一个问题,我们是否可以通过区 block 号来访问以太坊区 block 链上之前的区 block 数据。 例如我创建了一个block1、block2。 block
我创建了一个等距环境,全部使用 Javascript 和 HTML5 (2D Canvas),大部分情况下工作正常。我面临的问题是使用不同高度的图 block ,然后对图 block 上的对象索引进行
这是令我困惑的代码: public Integer getInteger(BlockingQueue queue) { boolean interrupted = false; try
我有一个基于 TPL 数据流的应用程序,它仅使用批处理 block 和操作 block 就可以正常工作。 我已经添加了一个 TransformBlock 以尝试在发布到批处理 block 之前从源中转
我是一名优秀的程序员,十分优秀!