- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这段代码完全按照我的意愿序列化了一个 32 字节的数组:
#[derive(Debug, Clone, Serialize, Deserialize, PartialEq, Eq, PartialOrd, Ord)]
struct Hash([u8; 32]);
let hash = Hash([1u8; 32]);
let hash_bin = bincode::serialize(&hash).unwrap();
assert_eq!(hash_bin, [1u8; 32]);
它是如何工作的?
根据 https://serde.rs/impl-serializer.html有一个 serialize_bytes()
函数,但 bincode 版本会在数据前添加一个长度。
fn serialize_bytes(self, v: &[u8]) -> Result<()> {
O::IntEncoding::serialize_len(self, v.len())?;
self.writer.write_all(v).map_err(Into::into)
}
代码(以上)调用 Serialize 中的什么函数,将 32 个字节序列化为它们本身,没有长度前缀?
上下文:我正在为一个类型实现一个客户序列化,我希望它(在某些情况下)序列化字节数组,以便 bincode 将它们编码为没有长度前缀的字节。这是一个问题,因为调用 serialize_bytes()
添加了一个长度前缀。
我想了解默认情况下字节数组是如何序列化的,因为我不知道要调用哪个方法来代替 serialize_bytes()
来获取没有长度前缀的字节。
最佳答案
[u8; N]
和 [u8]
序列化?简而言之,这里是如何serde
1.0.151 实现了每个方法。 serialize_bytes
实际上不是 serde
的一部分所以它被视为一个序列。
// [T; N] is serialized as a tuple. However, this is only implemented for N 0 to 32 inclusively.
let mut seq = try!(serializer.serialize_tuple(N));
for e in self {
try!(seq.serialize_element(e));
}
seq.end()
// [T] is serialized as a sequence.
serializer.collect_seq(self)
方法 serialize_tuple
和 collect_seq
由您正在使用的特定序列化程序实现。
一个常见的问题是 serde
只实现 Serialize
/Deserialize
对于长度不超过 32 的数组。最简单的方法是使用像 serde_with
这样的 crate 。它添加了额外的序列化/反序列化实现,您可以附加到您的结构。这是从他们的文档中摘录的示例:
#[serde_as]
#[derive(Deserialize, Serialize)]
struct Arrays<const N: usize, const M: usize> {
#[serde_as(as = "[_; N]")]
constgeneric: [bool; N],
#[serde_as(as = "Box<[[_; 64]; N]>")]
nested: Box<[[u8; 64]; N]>,
#[serde_as(as = "Option<[_; M]>")]
optional: Option<[u8; M]>,
}
Serialize
执行序列化实际上很容易。 Serde 没有数组的概念,所以我们需要在 serialize_tuple
之间进行选择。或 serialize_seq
.在引擎盖下,唯一的区别是 serialize_seq
可能没有已知长度,所以我们可以选择 serialize_tuple
.
pub fn serialize<S, T, const N: usize>(this: &[T; N], serializer: S) -> Result<S::Ok, S::Error>
where
S: Serializer,
T: Serialize,
{
let mut seq = serializer.serialize_tuple(N)?;
for element in this {
seq.serialize_element(element)?;
}
seq.end()
}
Deserialize
另一方面,反序列化变得有点复杂。我们需要定义一个访问者,然后指定应该如何访问每个元素。我写了一个例子来说明如何在数组的一般情况下完成它,但这不是最佳解决方案,因为它首先反序列化到堆栈上。我还必须使用 unsafe
代码一次只初始化数组一个元素,但是unsafe
如果T: Default
,代码很容易被删除或者如果扩展数据结构像 Vec<T>
而是使用。通常,这更旨在作为对序列实现反序列化的指南。
pub fn deserialize<'de, D, T, const N: usize>(deserializer: D) -> Result<[T; N], D::Error>
where
D: Deserializer<'de>,
T: 'de + Deserialize<'de>,
{
deserializer.deserialize_seq(ArrayVisitor { _phantom: PhantomData })
}
struct ArrayVisitor<'de, T, const N: usize> {
_phantom: PhantomData<&'de [T; N]>,
}
impl<'de, T, const N: usize> Visitor<'de> for ArrayVisitor<'de, T, N>
where
T: Deserialize<'de>,
{
type Value = [T; N];
fn expecting(&self, f: &mut fmt::Formatter) -> fmt::Result {
write!(f, "array of length {}", N)
}
fn visit_seq<A>(self, mut seq: A) -> Result<Self::Value, A::Error>
where
A: SeqAccess<'de>,
{
let mut array: MaybeUninit<[T; N]> = MaybeUninit::uninit();
for index in 0..N {
// Get next item as Result<Option<T>, A::Error>. Since we know
// exactly how many elements we should receive, we can flatten
// this to a Result<T, A::Error>.
let next = seq.next_element::<T>()
.and_then(|x| x.ok_or_else(|| Error::invalid_length(N, &self)));
match next {
Ok(x) => unsafe {
// Safety: We write into the array without reading any
// uninitialized memory and writes only occur within the
// array bounds at multiples of the array stride.
let array_base_ptr = array.as_mut_ptr() as *mut T;
ptr::write(array_base_ptr.add(index), x);
},
Err(err) => {
// Safety: We need to manually drop the parts we
// initialized before we can return.
unsafe {
let array_base_ptr = array.as_mut_ptr() as *mut T;
for offset in 0..index {
ptr::drop_in_place(array_base_ptr.add(offset));
}
}
return Err(err)
},
}
}
// Safety: We have completely initialized every element
unsafe { Ok(array.assume_init()) }
}
}
如果有人好奇如何derive(Deserialize)
适用于结构,我建议查看此 Rust Playground我在这里扩展了宏,然后清理了输出以使其更易于阅读。了解序列化/反序列化的工作原理确实有助于揭开这个过程的神秘面纱。
关于rust - serde/bincode 如何序列化字节数组?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67168397/
这段代码完全按照我的意愿序列化了一个 32 字节的数组: #[derive(Debug, Clone, Serialize, Deserialize, PartialEq, Eq, PartialOr
我在使用 Rust bincode 库时遇到问题。当它序列化一个向量时,它总是假设前缀长度是 8 个字节。当您始终使用 bincode 对数据进行编码时,这是一个很好的假设,因为 bincode 可以
所以我正在尝试反序列化由二进制数据 (bincode) 组成的消息,这个二进制文件不是由 serde 序列化的,但我正在尝试使用 serde 来反序列化它。但是,发送的数据可选地有一个原始数据部分,其
当我尝试运行测试时出现此异常: thread 'persistent_log::doc::test::test_sync' panicked at 'called `Result::unwrap()`
我对 Rust 相当陌生,并且在我的项目中使用 bincode。枚举变体的编码是我在与现有服务器交互时一直试图处理的一个问题。旧项目是用 C 语言编写的,并定义了“fshort-enums”的编译器选
这个问题在这里已经有了答案: Rust file I/O is very slow compared with C. Is something wrong? (1 个回答) 关闭 4 年前。 我有一
我正在使用 serde 和 bincode 映射二进制结构。 #[macro_use] extern crate serde_derive; extern crate serde; extern cr
我是一名优秀的程序员,十分优秀!