unix - Deflate压缩 block 的结构-6ren

unix - Deflate压缩 block 的结构

转载作者：行者123 更新时间：2023-12-02 03:04:13

24

4

我在理解 Deflate 算法时遇到困难 ( RFC 1951 )。

TL; DR如何解析Deflate压缩 block 4be4 0200？

我创建了一个包含字母和换行符 a\n 的文件，并运行 gzip a.txt。结果文件a.txt.gz:

1f8b 0808 fe8b eb55 0003 612e 7478 7400

4be4 0200

07a1 eadd 0200 0000

我知道第一行是带有附加信息的标题，最后一行是 CRC32 加上输入的大小( RFC 1951 )。这两个对我来说没有任何麻烦。

但是我如何解释压缩 block 本身(中间线)？

这是它的十六进制和二进制表示:

据我了解，不知何故这些:

Each block of compressed data begins with 3 header bits containing the following data:

first bit BFINAL

next 2 bits BTYPE

...实际上结束于第一个字节的末尾:0100 1011。 (我将跳过这个问题，为什么有人将实际上位于其他内容尾部的东西称为“标题”。)

据我所知，RFC 包含一些内容，应该是对此的解释:

Data elements are packed into bytes in order ofincreasing bit number within the byte, i.e., startingwith the least-significant bit of the byte.

Data elements other than Huffman codes are packedstarting with the least-significant bit of the dataelement.

Huffman codes are packed starting with the most-significant bit of the code.

In other words, if one were to print out the compressed data asa sequence of bytes, starting with the first byte at theright margin and proceeding to the left, with the most-significant bit of each byte on the left as usual, one would beable to parse the result from right to left, with fixed-widthelements in the correct MSB-to-LSB order and Huffman codes inbit-reversed order (i.e., with the first bit of the code in therelative LSB position).

但遗憾的是我不明白这个解释。

返回我的数据。 OK，那么BFINAL就设置好了，那么BTYPE又是什么呢？ 10 还是 01？

如何解释该压缩 block 中的其余数据？

最佳答案

首先让我们看看压缩数据的十六进制表示形式为一系列字节(而不是您问题中的一系列 16 位大端值):

4b e4 02 00

现在让我们将这些十六进制字节转换为二进制:

01001011 11100100 00000010 000000000

根据 RFC，这些位是“从字节的最低有效位开始”打包的。字节的最低有效位是该字节的最右边的位。所以第一个字节的第一位是这个:

01001011 11100100 00000010 000000000
       ^
       first bit

第二位是这个:

01001011 11100100 00000010 000000000
      ^
      second bit

第三位:

01001011 11100100 00000010 000000000
     ^
     third bit

等等。一旦您检查了第一个字节中的所有位，您就可以从第二个字节的最低有效位开始。所以第九位就是这个:

01001011 11100100 00000010 000000000
                ^
                ninth bit

最后一位，即三十秒位，是这样的:

01001011 11100100 00000010 000000000
                           ^
                           last bit

BFINAL 值是压缩数据中的第一位，因此包含在上面标记为“第一位”的单个位中。它的值为1，表示这是压缩数据的最后一个 block 。

BTYPE 值存储在数据的接下来两位中。这些是上面标记为“第二位”和“第三位”的位。唯一的问题是两者中哪一位是最低有效位，哪一位是最高有效位。根据 RFC，“霍夫曼代码以外的数据元素被打包从数据元素的最低有效位开始。”这意味着这两个位中的第一个，即标记为“第二位”的位，是最低有效位。这意味着 BTYPE 的值为 01 为二进制。因此表示该 block 是使用固定霍夫曼码压缩的。

这就是最容易完成的部分。解码压缩 block 的其余部分更加困难(并且对于更现实的示例，更加困难)。正确解释如何做到这一点将使这个答案对于本网站来说太长(并且您的问题太宽泛)。不过，我会给你一个提示，数据中接下来的三个元素是霍夫曼代码 10010001('a')、00111010('\n')和 0000000(流结束)。剩余的 6 位未使用，并且不是压缩数据的一部分。

请注意，要了解如何解码 deflate 压缩数据，您必须了解什么 Huffman codes是。您正在遵循的 RFC 假设您这样做。您还应该知道如何LZ77 compression有效，尽管该文档或多或少解释了您需要了解的内容。

关于unix - Deflate压缩 block 的结构，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32419086/

24

4

0

文章推荐： laravel - OAuth2 密码授予混淆

文章推荐： swift - 在 RealityKit 中更改对象的枢轴点

blockly - 在 blockly block 中读取用户输入的输入
我的 blockly.js 文件中有以下代码 Blockly.Blocks['account_number'] = { // Other type. init: function() {
Android将图像分成几 block 并获得等效大小的图像 block ( block )
首先抱歉我的英语不好，我正在开发 Image Splitter 应用程序并且已经完成，但是现在的要求是当图像被分割(分成几 block /chunks)那么图像 block 的每一 block (ch
block - smalltalk block - 我可以显式设置返回值并停止执行 block 吗？
#value: 消息的返回值，当发送到一个 block 时，是该 block 中最后一句话的值。所以 [ 1 + 2. 3 + 4. ] value 计算结果为 7。我发现有时很难使用。有没有办法显式
css - 当一个 block 高于其他 block 时，内联 block 对 block 应用顶部效果
我想构建一个包含 3 div 的响应式导航栏相同的 width和 height . 我申请了 inline-block到每个 block ，我得到一个我不理解的行为。问题是，第三 block 由 2
blockly - Blockly 有文件选择器吗？
我希望使用 Blockly 来允许非技术人员用户指定测试脚本。它的一部分需要一个文件选择器，但是，我看不到 Blockly 有一个。是吗？实际上，我找不到完整的标准 block 列表。谁有网址？
reactjs - 有没有办法在父 block 中知道您正在编辑该父 block 的内部 block ？
仅当您位于父 block 内部时，父 block 的 props.isSelected 才为 true，但当您在该 block 的 innerBlocks 内进行编辑时则不然。如何从父 block
reactjs - 有没有办法在父 block 中知道您正在编辑该父 block 的内部 block ？
仅当您位于父 block 内部时，父 block 的 props.isSelected 才为 true，但当您在该 block 的 innerBlocks 内进行编辑时则不然。如何从父 block
html - 我想创建一个具有不同背景颜色 block 和不同悬停颜色 block 的导航栏 block
我想创建一个具有不同背景颜色 block 和不同悬停颜色 block 的导航栏 block 。我可以分别创建不同的悬停颜色 block 或不同的背景颜色 block ，但不能一起创建。所以请告诉我如何
ios - block 指针变量 'block' 在被 block 捕获时未初始化
我正在使用看到的代码 here定期执行代码: #define DELAY_IN_MS 1000 __block dispatch_time_t next = dispatch_time(DISPATC
ios - 为什么必须复制 block 而不是保留 block ？什么时候不需要复制 block ？
为什么 block 必须被复制而不是保留？两者在引擎盖下有什么区别？在什么情况下不需要复制 block (如果有)？最佳答案通常，当您分配一个类的实例时，它会进入堆并一直存在，直到它被释放。但是，
ios - block block block ，用 __weak self
我想弄清楚我这样做是否正确: 如果我有一个 block ，我会这样做: __weak MyClass *weakSelf = self; [self performBlock:^{
javascript - 当单击部分中的每个 block 时，显示一个 block ，同时使用 jquery 隐藏其他 block 出现第二个 block ，第三个和第四个
我想制作一个 4 block 导航菜单，虽然我已经显示了一个 block ，然后单击打开第二个 block ，从第二个开始选择并再次单击出现第三个 block ，第四个 block 相同...这是我的
java - 最好在 try block 内有一个同步块(synchronized block)，还是在同步块(synchronized block)内有一个 try block ？
例如，这样更好吗？ try { synchronized (bean) { // Write something } } catch (Int
simulation - 尝试检查前方色 block 并根据前方色 block 的色 block 颜色做出决定
我想让一只乌龟检查前方小块的颜色并决定移动到哪里。如果前面的补丁不是白色的，那么乌龟向左或向右旋转并移动。我的 If 决策结构中出现错误，显示“此处应为 TRUE？FALSE，而不是 block 列表
在 block 矩阵的对角部分重复 block 矩阵多次，非对角 block 全部为零矩阵？
我想创建一个 block 对角矩阵，其中对角 block 重复一定次数，非对角 block 都是零矩阵。例如，假设我们从一个矩阵开始: > diag.matrix [,1] [,2] [
blockchain - 如何通过区 block 号访问以太坊区 block 链上一个区 block 的数据？
我是区 block 链新手。突然我有一个问题，我们是否可以通过区 block 号来访问以太坊区 block 链上之前的区 block 数据。例如我创建了一个block1、block2。 block
blockchain - 如何通过区 block 号访问以太坊区 block 链上一个区 block 的数据？
我是区 block 链新手。突然我有一个问题，我们是否可以通过区 block 号来访问以太坊区 block 链上之前的区 block 数据。例如我创建了一个block1、block2。 block
game-engine - 如何在不与其他图 block 重叠的情况下将等距对象从一个图 block 过渡到另一个图 block
我创建了一个等距环境，全部使用 Javascript 和 HTML5 (2D Canvas)，大部分情况下工作正常。我面临的问题是使用不同高度的图 block ，然后对图 block 上的对象索引进行
java - 如果try block 中有 "Where (true)" block ，是否会到达finally block ？
这是令我困惑的代码: public Integer getInteger(BlockingQueue queue) { boolean interrupted = false; try
c# - TPL 数据流转换 block 发布到批处理 block ，然后是操作 block
我有一个基于 TPL 数据流的应用程序，它仅使用批处理 block 和操作 block 就可以正常工作。我已经添加了一个 TransformBlock 以尝试在发布到批处理 block 之前从源中转

首页

博学

6Ren·AI

商城

unix - Deflate压缩 block 的结构