- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我使用二进制序列化 (BinaryFormatter) 作为临时机制,将状态信息存储在文件中,用于相对复杂的(游戏)对象结构;文件出来 比我预期的大 ,并且我的数据结构包括递归引用 - 所以我想知道 BinaryFormatter 是否实际上存储了相同对象的多个副本,或者我的基本“对象和值的数量”应该有”算法是偏离基础的,或者过大的尺寸来自哪里。
搜索堆栈溢出,我能够找到 Microsoft 的二进制远程处理格式的规范:
http://msdn.microsoft.com/en-us/library/cc236844(PROT.10).aspx
我找不到任何现有的查看器,它使您能够“窥视”二进制格式化程序输出文件的内容 - 获取文件中不同对象类型的对象计数和总字节数等;
我觉得这一定是我的“google-fu”让我失望了(我只有一点点)-有人可以帮忙吗?这应该是以前做过的吧??
UPDATE :我找不到它,也没有得到答案,所以我把一些相对较快的东西放在一起(链接到下面的可下载项目);我可以确认 BinaryFormatter 不会存储同一对象的多个副本,但它确实将大量元数据打印到流中。如果您需要高效的存储,请构建您自己的自定义序列化方法。
最佳答案
因为它可能对某些人感兴趣,所以我决定写这篇关于 的文章 序列化 .NET 对象的二进制格式是什么样的,我们如何正确解释它?
我所有的研究都基于 .NET Remoting: Binary Format Data Structure 规范。
示例类:
为了有一个工作示例,我创建了一个名为 A
的简单类,它包含 2 个属性,一个字符串和一个整数值,它们分别称为 SomeString
和 SomeValue
。
类 A
如下所示:
[Serializable()]
public class A
{
public string SomeString
{
get;
set;
}
public int SomeValue
{
get;
set;
}
}
对于序列化,我当然使用了
BinaryFormatter
:
BinaryFormatter bf = new BinaryFormatter();
StreamWriter sw = new StreamWriter("test.txt");
bf.Serialize(sw.BaseStream, new A() { SomeString = "abc", SomeValue = 123 });
sw.Close();
可以看出,我传递了一个类
A
的新实例,其中包含
abc
和
123
作为值。
RecordTypeEnumeration
标识。第
2.1.2.1 RecordTypeNumeration
节指出:
This enumeration identifies the type of the record. Each record (except for MemberPrimitiveUnTyped) starts with a record type enumeration. The size of the enumeration is one BYTE.
2.1.2.1 RecordTypeEnumeration
中所述,
0
的值标识了
SerializationHeaderRecord
中指定的
2.6.1 SerializationHeaderRecord
:
The SerializationHeaderRecord record MUST be the first record in a binary serialization. This record has the major and minor version of the format and the IDs of the top object and the headers.
00
代表
RecordTypeEnumeration
,在我们的例子中是
SerializationHeaderRecord
。
01 00 00 00
代表
RootId
If neither the BinaryMethodCall nor BinaryMethodReturn record is present in the serialization stream, the value of this field MUST contain the ObjectId of a Class, Array, or BinaryObjectString record contained in the serialization stream.
ObjectId
,其值为
1
(因为数据是使用 little-endian 序列化的),我们希望再次看到它;-)
FF FF FF FF
代表
HeaderId
01 00 00 00
代表
MajorVersion
00 00 00 00
代表
MinorVersion
RecordTypeEnumeration
开头。随着最后一条记录完成,我们必须假设新的记录开始了。
SerializationHeaderRecord
后面是
BinaryLibrary
记录:
The BinaryLibrary record associates an INT32 ID (as specified in [MS-DTYP] section 2.2.22) with a Library name. This allows other records to reference the Library name by using the ID. This approach reduces the wire size when there are multiple records that reference the same Library name.
LengthPrefixedString
))2.1.1.6 LengthPrefixedString
所述...
The LengthPrefixedString represents a string value. The string is prefixed by the length of the UTF-8 encoded string in bytes. The length is encoded in a variable-length field with a minimum of 1 byte and a maximum of 5 bytes. To minimize the wire size, length is encoded as a variable-length field.
1 byte
进行编码。有了这些知识,我们可以继续解释流中的字节:
0C
代表
RecordTypeEnumeration
,它标识了
BinaryLibrary
记录。
02 00 00 00
代表
LibraryId
,在我们的例子中是
2
。
LengthPrefixedString
如下:
42
表示包含
LengthPrefixedString
的
LibraryName
的长度信息。
42
(十进制 66)的长度信息告诉我们,我们需要读取接下来的 66 个字节并将它们解释为
LibraryName
。
UTF-8
编码的,因此上述字节的结果将类似于:
_WorkSpace_, Version=1.0.0.0, Culture=neutral, PublicKeyToken=null
RecordTypeEnumeration
:
05
标识
ClassWithMembersAndTypes
记录。第
2.3.2.1 ClassWithMembersAndTypes
节指出:
The ClassWithMembersAndTypes record is the most verbose of the Class records. It contains metadata about Members, including the names and Remoting Types of the Members. It also contains a Library ID that references the Library Name of the Class.
2.3.1.1 ClassInfo
所述,记录包括:
LengthPrefixedString
))LengthPrefixedString
的序列,其中项目的数量必须等于 MemberCount
字段中指定的值。) 0x291911224233301 00 00 00
代表 ObjectId
。我们已经看到了这个,它在 RootId
中被指定为 SerializationHeaderRecord
。0F 53 74 61 63 6B 4F 76 65 72 46 6C 6F 77 2E 41
表示使用 Name
表示的类的 LengthPrefixedString
。如前所述,在我们的示例中,字符串的长度定义为 1 个字节,因此第一个字节 0F
指定必须使用 UTF-8 读取和解码 15 个字节。结果看起来像这样:StackOverFlow.A
- 所以很明显我使用了 StackOverFlow
作为命名空间的名称。02 00 00 00
代表 MemberCount
,它告诉我们有 2 个成员,都用 LengthPrefixedString
表示。1B 3C 53 6F 6D 65 53 74 72 69 6E 67 3E 6B 5F 5F 42 61 63 6B 69 6E 67 46 69 65 6C 64
代表第一个 MemberName
, 1B
也是字符串的长度,它是 27 个字节的长度,结果如下: 0x25181242313431<SomeString>k__BackingField
表示第二个 1A 3C 53 6F 6D 65 56 61 6C 75 65 3E 6B 5F 5F 42 61 63 6B 69 6E 67 46 69 65 6C 64
, MemberName
指定字符串为 26 字节长。结果如下: 1A
。<SomeValue>k__BackingField
之后是 ClassInfo
。MemberTypeInfo
节指出,该结构包含:A sequence of BinaryTypeEnumeration values that represents the Member Types that are being transferred. The Array MUST:
Have the same number of items as the MemberNames field of the ClassInfo structure.
Be ordered such that the BinaryTypeEnumeration corresponds to the Member name in the MemberNames field of the ClassInfo structure.
2.3.1.2 - MemberTypeInfo
附加信息可能存在也可能不存在。
| BinaryTypeEnum | AdditionalInfos |
|----------------+--------------------------|
| Primitive | PrimitiveTypeEnumeration |
| String | None |
BinaryTpeEnum
值(因为我们在
BinaryTypeEnumeration
中有 2 个成员)。
MemberNames
记录的原始数据:
MemberTypeInfo
代表第一个成员的
01
,根据
BinaryTypeEnumeration
我们可以期待一个
2.1.2.2 BinaryTypeEnumeration
,它用 0x21418 表示。
String
代表第二个成员的
LengthPrefixedString
,同样,根据规范,它是
00
。如上所述,
BinaryTypeEnumeration
后面是附加信息,在这种情况下是
Primitive
。这就是为什么我们需要读取下一个字节,即
Primitive
,将其与
PrimitiveTypeEnumeration
中所述的表进行匹配,并惊讶地注意到我们可以预期
08
由一些其他文档表示,关于基本数据类型。
2.1.2.3 PrimitiveTypeEnumeration
之后是
Int32
,用4个字节表示:
MemerTypeInfo
代表
LibraryId
,即 2。
02 00 00 00
中所述:
The values of the Members of the Class MUST be serialized as records that follow this record, as specified in section 2.7. The order of the records MUST match the order of MemberNames as specified in the ClassInfo (section 2.3.1.1) structure.
LibraryId
标识
2.3 Class Records
。它代表我们的
06
属性的值(准确地说是
BinaryObjectString
)。
SomeString
它包含:
<SomeString>k__BackingField
) 2.5.7 BinaryObjectString
代表
LengthPrefixedString
。
03 00 00 00
表示
ObjectId
,其中
03 61 62 63
是字符串本身的长度,
Value
是转换为 0x23134 的内容字节。13
03
。知道
61 62 63
用 4 个字节表示,我们可以得出结论,即
abc
。
Int32
十六进制等于
Int32
十进制,这似乎适合我们的示例代码。
Value
记录:
7B
代表
123
记录。
关于c# - 如何分析二进制序列化流的内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3052202/
我刚刚继承了一个旧的 PostgreSQL 安装,需要进行一些诊断以找出该数据库运行缓慢的原因。在 MS SQL 上,您可以使用 Profiler 等工具来查看正在运行的查询,然后查看它们的执行计划。
将目标从Analytics(分析)导入到AdWords中,然后在Analytics(分析)中更改目标条件时,是否可以通过更改将目标“重新导入”到AdWords,还是可以自动选择? 最佳答案 更改目标值
我正在使用google analytics api来获取数据。我正在获取数据,但我想验证两个参数,它们在特定日期范围内始终为0。我正在获取['ga:transactions']和['ga:goalCo
我使用Google API从Google Analytics(分析)获取数据,但指标与Google Analytics(分析)的网络界面不同。 即:我在2015年3月1日获得数据-它返回综合浏览量79
我在我的Web应用程序中使用sammy.js进行剔除。我正在尝试向其中添加Google Analytics(分析)。我很快找到了following plugin来实现页面跟踪。 我按照步骤操作,页面如
当使用 Xcode 分析 (product>analyze) 时,有没有办法忽略给定文件中的任何错误? 例如编译指示之类的? 我们只想忽略第三方代码的任何警告,这样当我们的代码出现问题时,它对我们
目录 EFK 1. 日志系统 2. 部署ElasticSearch 2.1 创建handless服务 2.2 创建s
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve thi
GCC/G++ 是否有可用于输出分析的选项? 能够比较以前的代码与新代码之间的差异(大小、类/结构的大小)将很有用。然后可以将它们与之前的输出进行比较以进行比较,这对于许多目的都是有用的。 如果没有此
我正在浏览 LYAH,并一直在研究处理列表时列表理解与映射/过滤器的使用。我已经分析了以下两个函数,并包含了教授的输出。如果我正确地阅读了教授的内容,我会说 FiltB 的运行速度比 FiltA 慢很
在 MySQL 中可以使用 SET profiling = 1; 设置分析 查询 SHOW PROFILES; 显示每个查询所用的时间。我想知道这个时间是只包括服务器的执行时间还是还包括将结果发送到前
我用 Python 编写了几个用于生成阶乘的模块,我想测试运行时间。我找到了一个分析示例 here我使用该模板来分析我的模块: import profile #fact def main():
前几天读了下mysqld_safe脚本,个人感觉还是收获蛮大的,其中细致的交代了MySQL数据库的启动流程,包括查找MySQL相关目录,解析配置文件以及最后如何调用mysqld程序来启动实例等,有着
上一篇:《人工智能大语言模型起源篇,低秩微调(LoRA)》 (14)Rae 和同事(包括78位合著者!)于2022年发表的《Scaling Language Models: Methods, A
1 内网基础 内网/局域网(Local Area Network,LAN),是指在某一区域内有多台计算机互联而成的计算机组,组网范围通常在数千米以内。在局域网中,可以实现文件管理、应用软件共享、打印机
1 内网基础 内网/局域网(Local Area Network,LAN),是指在某一区域内有多台计算机互联而成的计算机组,组网范围通常在数千米以内。在局域网中,可以实现文件管理、应用软件共享、打印机
我有四列形式的数据。前三列代表时间,value1,value 2。第四列是二进制,全为 0 或 1。当第四列中对应的二进制值为0时,有没有办法告诉excel删除时间、值1和值2?我知道这在 C++ 或
我正在运行一个进行长时间计算的 Haskell 程序。经过一些分析和跟踪后,我注意到以下内容: $ /usr/bin/time -v ./hl test.hl 9000045000050000 Com
我有一个缓慢的 asp.net 程序正在运行。我想分析生产服务器以查看发生了什么,但我不想显着降低生产服务器的速度。 一般而言,配置生产盒或仅本地开发盒是标准做法吗?另外,您建议使用哪些程序来实现这一
我目前正在尝试分析 Haskell 服务器。服务器永远运行,所以我只想要一个固定时间的分析报告。我尝试只运行该程序 3 分钟,然后礼貌地要求它终止,但不知何故,haskell 分析器不遵守术语信号,并
我是一名优秀的程序员,十分优秀!