gpt4 book ai didi

types - 如何确定不同编码/序列化/等之间的差异?

转载 作者:行者123 更新时间:2023-12-01 09:05:12 26 4
gpt4 key购买 nike

是否有所有类型的数据格式解码器,例如 Base64、ASP EventValidation 对象、XML 序列化或其他?我可以做一个简单的测试吗?

For example, I have a string here, it's part of a cgi-based web form, it's obviously hex (full size is 5kb): 52616e646f6d49567ef61b360522ae5ae69064f0ecb664a831c4196dad319215013aa8d04726b5d54ed673dad2004726c35e66d8b19c5177a331b24988f3cf11871084f6cc9ff808baf5cdee83f031a56dc42b65ee5309f1f1

我不知道那是什么,十六进制到 ascii 给了我更多废话,比如 Ra_d__IVo6"Odd1_1/G&?sG&OfQw1I1_eS,它显然不是 base 64 字符串...

问题基本上是:除了查看不同的类型、尝试并猜测之外,还有其他方法吗?

编辑:我认为这个字符串是基于 perpended 52616e646f6d4956 的加密数据,但我的问题不是字符串是什么,而是我如何轻松分辨这些东西。

最佳答案

您可以开发自己的启发式算法。类似于病毒扫描程序。它不是 100% 有效,但应该会随着时间的推移而改善。例如,您可以获取字符串并注意到它仅包含十六进制字母表中的字符,将其标记为可能被加密、压缩或与十六进制字符集相关的任何其他内容。

您可以扩展启发式以尝试 N 种不同的编码并执行字数统计。这可能有助于缩小编码的可能性,但在简单的情况下,比如标准英文字母,编码表之间有很多重叠,所以你肯定会得到误报。但是,只要重叠不包含字符的外部/不匹配,您仍然应该获得可读的内容。

正如 Marc 所指出的,并非所有内容都一定是可读的内容。图片、zip 文件和其他数据列表在转换为编码表表示时将产生纯粹的废话。但是,即使是这样的项目也有可能包含启发式检测到的一致数据。

这个主题可能会涉及很多。看看TCP协议(protocol)就知道了。一个人不只是在互联网上发送数据包,并期望在客户端对数据进行一些神奇的解释。有预定义的规则(协议(protocol))来定义客户端/服务器之间传输数据的方式和类型。因此,要直接回答有关“猜测”的问题,您无法确定您将收到的数据或您的解释,但您当然可以开发比“猜测”更智能的应用程序。

关于types - 如何确定不同编码/序列化/等之间的差异?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4249153/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com