- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我是过时的帝国时代 II(AoE) 的粉丝。我想用 Python 编写 AoE 游戏记录(.mgx 文件)的解析器。
我在 GitHub 上做了一些搜索,发现了一些关于这个的项目,最有用的是 aoc-mgx-format提供some details of .mgx game record files .
问题是:
根据引用,.mgx 文件的结构如下:
| header_len(4byte int) | next_pos(4byte int) | header_data | ... ... |
mgx 格式的十六进制数据的字节顺序是小端。
header_len
存储Header部分的数据长度(header_len
+ next_post
+ header_data
)
header_data
存储我需要的有用信息,但它是用 zlib
我尝试使用 zlib 模块解压 header_data
中的数据,如下所示:
import struct
import zlib
with open('test.mgx', "rb") as fp:
# read the header_len bytes and covert it to a int reprents length of Header part
header_len = struct.unpack("<i", fp.read(4))[0]
# read next_pos (this is not important for me)
next_pos = struct.unpack("<i", fp.read(4))[0]
# then I can get data length of header_data part(compressed with zlib)
header_data_len = header_len - 8
compressed_data = fp.read(header_data_len)[::-1] # need to be reversed because byte order is little endian?
try:
zlib.decompress(compressed_data)
print "can be decompressed!"
except zlib.error as e:
print e.message
但是我在运行程序后得到了这个:
Error -3 while decompressing data: incorrect header check
PS:示例 .mgx 文件可在此处找到:https://github.com/stefan-kolb/aoc-mgx-format/tree/master/parser/recs
最佳答案
您的第一个问题是您不应该反转数据;只需删除 [::-1]
。
但是如果你这样做,你会得到一个不同的错误 -3,而不是那个错误 -3,通常是关于未知的压缩方法。
问题是这是 headless zlib 数据,很像gzip 使用的数据。理论上,这意味着有关压缩方法、窗口、开始指令等的信息必须在文件的其他地方提供(在 gzip 的情况下,通过 gzip header 中的信息)。但在实践中,每个人都使用具有最大窗口大小的 deflate 并且没有开始指令,所以如果我在每个字节都计算在内的日子里为游戏设计一种紧凑的格式,我只会对它们进行硬编码。 (在现代,正是在 RFC 中将其标准化为“DEFLATE 压缩数据格式”,但大多数 90 年代的 PC 游戏在设计上并未遵循 RFC...)
所以:
>>> uncompressed_data = zlib.decompress(compressed_data, -zlib.MAX_WBITS)
>>> uncompressed_data[:8] # version
b'VER 9.8\x00'
>>> uncompressed_data[8:12] # unknown_const
b'\xf6(<A'
所以,它不仅解压缩了,它看起来像一个版本,而且……好吧,我猜任何东西看起来都像一个未知常量,但它在规范中是相同的未知常量,所以我认为我们很好。
作为decompress
文档解释,MAX_WBITS
是默认/最常见的窗口大小(也是通常称为“zlib deflate”而不是“zlib”的唯一大小),传递负值意味着标题被压制;我们可以保留默认值的其他参数。
另见 this answer , Advanced Functions zlib
文档中的部分,以及 RFC 1951 . (感谢 OP 找到链接。)
关于python - 解析帝国时代游戏记录文件(.mgx),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29690791/
我是一名优秀的程序员,十分优秀!