- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我被要求处理一些序列化为二进制文件(不幸的是不是文本/JSON)Thrift对象,但我无权访问创建文件的程序或程序员,所以我不知道它们的结构、字段顺序等。有没有办法使用 Thrift 库打开二进制文件并分析它,获取字段类型、值、嵌套等的列表?
最佳答案
不幸的是,Thrift 的二进制协议(protocol)似乎根本没有对数据进行太多标记。解码它似乎假设你手头有 .thrift 文件,所以你知道,比如说,接下来的 4 个字节应该是一个整数,实际上不是浮点数的前半部分。因此,基本上,您似乎被困在十六进制编辑器(或等效)中查看文件并尝试根据您看到的确切模式推断字段。
有一些有用的位:
每个文件都以版本、协议(protocol)标识符字符串和序列号开头。映射将以 6 个字节开始,标识键和值类型(前两个字节,作为整数代码)加上元素数量作为 4 字节整数。类型代码似乎是标准的(它们定义的规范位置似乎是 Thrift 源中的 TProtocol.h,例如, bool 值由类型代码 2 指定,UTF-8 字符串由类型代码 16 指定,等等) .字符串以 4 字节整数长度字段为前缀,列表以类型(1 字节)和 4 字节长度为前缀。看起来所有整数字段都以大端方式保存,浮点数以 IEEE 格式保存(这应该使 double 数相对容易找到,至少)。
Thrift 中的 TBinaryProtocol* 文件有一些更有用的细节;从好的方面来说,有许多不同的实现,因此您可以阅读以您最熟悉的语言实现的那些。
抱歉,我知道这可能没有那么有用,但确实看起来这是 Thrift 二进制格式提供的所有信息;显然,二进制格式的设计目的是让您始终知道确切的协议(protocol)规范,并且目标是最小化线路空间,而不是使其易于盲目解码。
关于binary - 如何对二进制 thrift 文件进行逆向工程?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1561693/
我对以下树的术语感到困惑,我一直在研究树,但无法区分这些树: a) 完全二叉树 b) 严格二叉树 c) 完整二叉树 请帮我区分这些树。这些树何时何地在数据结构中使用? 最佳答案 完美的树:
我正在检查数字系统并在它们之间进行转换。 我认为十六进制值比二进制使用更少的位,这是有道理的,但最终十六进制值不是存储为位吗?这似乎最终打败了目的。 最佳答案 几乎在所有情况下,计算机使用的所有数据最
任何人都可以在 Cudd 包上指出一些好的 Material 吗?我在这里寻找一些简洁的事情。位于 http://vlsi.colorado.edu/~fabio/CUDD/ 的那个似乎没有对此事做出
我正在检查数字系统并在它们之间进行转换。 我认为十六进制值比二进制使用更少的位,这是有道理的,但最终十六进制值不是存储为位吗?这似乎最终打败了目的。 最佳答案 几乎在所有情况下,计算机使用的所有数据最
在我的应用程序中,我需要序列化一个包含任意数据类型的向量,在本例中是一个 Doubles 列表。为了序列化我正在导入 Data.Vector.Binary 的向量。 在 GHCi 中加载模块时出现以下
我尝试通过 sqlalchemy 将二进制文件存储到 postgresql 中,并从客户端上传文件。 对错误消息的一点谷歌把我带到 this source file :“包装的对象不是字节或缓冲区,这
我从表(源)中执行 INSERT SELECT,其中每列都是 VARCHAR 数据类型。 其中一列存储二进制数据,例如 '0003f80075177fe6' 我插入的目标表具有相同的列,但具有正确的数
无法简单地将二进制文件复制到 Linux 机器。哇!我今天觉得很蠢!以下是从默认镜像和 utah.edu 下载的二进制包的 tar.gz 中的文件列表: -rwxr-xr-x 1 ec2-user e
我正在阅读关于 Binary search 的不同 Material ,我不清楚它是一个贪婪的二进制文件(在我看来它不是)或者,它可以是一个具有某些特定实现的贪婪算法吗? 如果它可以是贪心的,它有什么
我见过这样写的代码: ifstream fin; fin.open("largefile.dat", ifstream::binary | ifstream::in); 现在这让我感到困惑,上面的代码
binary(10) vs char(10)character set binary有什么区别? 还有varbinary(10) vs varchar(10)字符集二进制? 它们在所有 MySQL 引
binary(10) vs char(10)character set binary有什么区别? 还有varbinary(10) vs varchar(10)字符集二进制? 它们在所有 MySQL 引
我尝试将一些数据插入到从 mysql 中的另一个表检索的表中,该表的数据类型为 BINARY(20)。 提取的数据位于变量$binary['hash']; /l÷ˆ8Ô]¿\µK prepare("I
在我的一个站点上,我有一个主用户表,其中包含每个用户的唯一用户 ID、电子邮件地址、密码等。 我需要开始跟踪很多与每个用户相关的二进制标志,比如他们是否确认了他们的电子邮件,他们是否发布了消息,他们是
在最近 SO discussion我展示了一个需要修剪顶点 6 和 7 的二叉分类树: 下面是我使用的代码: KaryTree[9, 2, VertexLabels -> {1 -> "Blood
请解释一下,对于以下查询,在 Mysql 中哪个会更快? SELECT * FROM `userstatus` where BINARY Name = 'Raja' [OR] SELECT * FRO
我通过定义 ngram_vectorizer = CountVectorizer(binary=True) 和 ngram_vectorizer = CountVectorizer(binary=Fa
在 C++ 中搜索文件读取示例时,我注意到许多示例使用 std::ios::binary 与 std::ifstream::binary std::ios::beg 与 your_file_strea
我在这里和其他论坛上看到过旧帖子,其代码与下面的代码类似,但无法弄清楚其中的一部分来自哪里。 let Source = Table.FromRows(Json.Document(Binary.
#include #include #define SIGBAD(signo) ((signo) = NSIG) int sigaddset(sigset_t *set, int signo
我是一名优秀的程序员,十分优秀!