gpt4 book ai didi

c++ - 使用 C 或 C++ 在大型二进制文件中查找模式?

转载 作者:塔克拉玛干 更新时间:2023-11-03 00:36:48 25 4
gpt4 key购买 nike

我有一个大约 700 MB 的二进制文件(非文本数据);我想做的是搜索在整个文件的随机位置出现的特定字节模式。例如0x? 0x? 0x55 0x? 0x? 0x55 0x? 0x? 0x55 0x? 0x? 0x55 依次类推 50 个字节左右。我要搜索的模式是两个随机字节的序列,每两个字节出现 0x55。

即查找以0x55为分隔符的文件中存储的表,然后保存表中包含的数据或进行其他操作。

最好的选择是一次一个地遍历每个单独的字节,然后向前看两个字节以查看该值是否为 0x55,如果是,则一次又一次地向前看以确认表存在在那个位置?

加载整个东西?寻找?缓冲区 block ,一次搜索一个字节?

使用 C 或 C++ 查看这个大文件并找到模式的最佳方法是什么?

最佳答案

这对于 regular expression 来说听起来不错匹配器或 deterministic finite automaton .这些是专为满足您的要求而设计的强大工具,如果您可以随意使用它们,那么进行此类搜索应该不会有太多麻烦。在 C++ 中,考虑查看 Boost.Regex库,它们应该具有解决此问题所需的所有功能。

关于c++ - 使用 C 或 C++ 在大型二进制文件中查找模式?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5047299/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com