c++ - Protocol Buffer ParseFromString 不检查消息结尾-6ren

c++ - Protocol Buffer ParseFromString 不检查消息结尾

转载作者：行者123 更新时间：2023-11-28 04:35:36

48

4

我发现了一个关于 Protocol Buffer 的有趣问题。如果您有两条相似的消息，则可以使用 C++ API 或命令行像解析另一条消息一样解析一条消息。

limited documentation for ParseFromString没有提到它不需要消耗所有的字符串，如果不消耗也不会失败。

我原以为 ParseFromString 无法解析类型 A 的消息，如果它与类型 B 的消息一起显示的话。毕竟消息包含额外的数据。然而，这种情况并非如此。一个示例脚本演示了这个问题:

#!/bin/sh

cat - >./foobar.proto <<EOF
syntax = "proto3";
package demo;
message A
{
   uint64 foo = 1;
};

enum flagx { 
  y = 0; 
  z = 1; 
}

message B {
   uint64 foolish = 1;
   flagx bar = 2;
};

EOF

cat - >./mess.B.in.txtfmt <<EOF
foolish: 10
bar: y
EOF

cat - >./mess.in.txtfmt <<EOF
foo: 10
EOF

protoc --encode=demo.A foobar.proto <./mess.A.in.txtfmt >./mess.A.proto
protoc --encode=demo.B foobar.proto <./mess.B.in.txtfmt >./mess.B.proto
protoc --decode=demo.A foobar.proto >./mess.out.txtfmt <./mess.B.proto

echo "in: "
cat mess.B.in.txtfmt
echo "out: "
cat mess.out.txtfmt

echo "xxd mess.A.proto:"
xxd mess.A.proto

echo "xxd mess.B.proto:"
xxd mess.B.proto

输出是:

in: 
foolish: 10
bar: 20
out: 
foo: 10
xxd mess.A.proto:
00000000: 080a                                    
xxd mess.B.proto:
00000000: 080a

因此消息 A 和 B 的二进制消息是相同的。

如果你改变协议(protocol)，而不是枚举，你有另一个 varint (uint64)，你会得到不同的二进制消息，但是ParseFromString 仍会成功地将较长的消息解析为较短的消息。

真正令人困惑的是，它似乎还能够将较短的消息解析为较长的消息。

这是错误还是功能？

最佳答案

我认为这是设计使然，但文档可能会更好。

如果您尝试使用 API 而没有先阅读有关有线格式的信息，则可能会出现这种混淆。如您所料，有线格式与 API 并非无关紧要。

有线格式强调紧凑性而非正确性。如果您想检查消息的正确性，我们邀请您使用其他方式。

您可以(可以说应该或必须)在您的消息中包含以下一项或多项内容:

消息类型字段
消息长度字段
校验和

关于能够将较短消息解析为较长消息的第二点是因为在 Protocol Buffer 3 中，所有字段都是可选的。protocol buffers 2 有一个必填字段的概念。它的删除引起了一些争议(参见例如 Why required and optional is removed in Protocol Buffers 3 和 https://capnproto.org/faq.html#how-do-i-make-a-field-required-like-in-protocol-buffers )。消息中不包含具有默认值(通常为 0)的字段。字段名称也由数字代替。因此，“不同”协议(protocol)的两条消息可能很容易被双方解释。

关于c++ - Protocol Buffer ParseFromString 不检查消息结尾，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51562541/

48

4

0

文章推荐： C++ Qt QtConcurrent::filteredReduced 从 std::shared_ptr 的 QVector

文章推荐： c++ - 共享内存和性能

文章推荐： jquery - 使用 jQuery 使整个 Div 可点击

node.js - 为什么 `buffer` 和 `new Buffer(buffer.toString())` 并不总是逐字节相等？
我期望 new Buffer(buffer.toString()) 始终是逐字节相等的。但是，我遇到的情况并非如此。首先，这是一个真实的案例: var buf1 = new Buffer(32);
protocol-buffers - Protocol Buffer 对象的增量写入
我有用于记录数据的 Protocol Buffer 。 message Message { required double val1 = 1; optional int val2 =
protocol-buffers - Protocol Buffer 是否支持具有共享引用的对象图的序列化？
请注意以下简单程序(基于 protobuf-net 项目 v1 wiki 中的示例): using System.Collections.Generic; using System.Diagnosti
protocol-buffers - Protocol Buffers 消息中的集合？
在 Protocol Buffer 中，有没有办法让消息包含嵌套消息的集合？例如，消息主管可能有一个员工集合以及主管的姓名和部门。最佳答案是的。您使用 repeated领域； message Em
protocol-buffers - 损坏的数据和 Protocol Buffer
我想知道 Protocol Buffer 在解析流时如何处理损坏的数据。有没有办法知道数据是否已损坏。 Protocol Buffer 是否提供任何内置的数据完整性检查机制？谢谢，最佳答案没有任
protocol-buffers - Protocol Buffer 如何处理版本控制？
Protocol Buffer 如何处理类型版本控制？例如，当我需要随时间更改类型定义时？就像添加和删除字段一样。最佳答案 Google 设计的 protobuf 对版本控制非常宽容: 意外数据要
protocol-buffers - Protocol Buffer - 用例
我尝试阅读 Protobuf 文档，但无法想象它可以用于许多用例。我想知道一些实际的 Protocol Buffer 性能改进用例。谢谢最佳答案 Protocol buffers 是一个序列化库，
protocol-buffers - Protocol Buffer 序列化输出是否完全确定？
给定 Protocol Buffer 模式和一些数据， Protocol Buffer 序列化是否跨库和语言具有确定性？基本上，无论使用什么库，我是否可以保证相同的数据总是以相同的方式(直到字节)序
uwp - 如何将字节复制到 Windows::Storage::Streams::Buffer 或 Buffer 以通过 Windows::Storage::Streams::DataWriter::Write Buffer() 输出
我正在使用一个示例 UWP C++/CX 程序，该程序创建两个 UDP 网络通信线程，它们使用 Windows::Storage::Streams::DataWriter 相互发送数据。和 Windo
protocol-buffers - Google Protocol Buffer 错误 : "Encountered string containing invalid UTF-8 data while serializing protocol buffer"
我正在使用以下代码 int lenSend = odl->ByteSize(); char* buf = (char *)malloc(lenSend); odl->SerializeToArray(
protocol-buffers - 从生成的 Protocol Buffer 类继承
Protocol Buffer 文档警告说...... You should never add behaviour to the generated classes by inheriting fr
protocol-buffers - 停止省略 Protocol Buffer 中的默认值
我有一个定义如下的原型(prototype)模式， message User { int64 id = 1; bool email_subscribed = 2; bool sms_
protocol-buffers - 如何解释 Protocol Buffer 的嵌入式消息二进制有线格式？
我试图了解 Protocol Buffer 编码方法，将消息转换为二进制(或十六进制)格式时，我无法理解嵌入消息的编码方式。我猜可能和内存地址有关，但我找不到准确的关系。这是我所做的。第 1 步
protocol-buffers - 确定 Protocol Buffer 消息类型的最佳实践
我需要序列化和反序列化一系列与字节流之间的 Protocol Buffer 消息。有一些预先确定的消息类型。编码类型信息的推荐方法是什么，以便我的应用程序可以知道它应该读取哪种类型？最佳答案最常见
protocol-buffers - gson vs Protocol Buffer
与GSON相比， Protocol Buffer (protobuf)的优缺点是什么？在什么情况下，protobuf比GSON更合适？对于一个非常笼统的问题，我感到抱歉。最佳答案 json(通过
protocol-buffers - 如何在 Protocol Buffer 中提供默认值？
message Person { required Empid = 1 [default = 100]; required string name = 2 [default = "Raju"]
protocol-buffers - Google Protocol Buffer 的典型内存空间使用情况是多少？
我正在研究一个小型设备，该设备具有相当大的一组配置参数(~100 KB)，这些参数是从 PC 软件生成的。过去，我们将参数存储在二进制文件中并将它们加载到数据结构中。维护有点烦人(不同的语言，确保结构
protocol-buffers - Google Protocol Buffer :ZigZag编码
来自Encoding - Protocol Buffers - Google Code上的“签名类型”: ZigZag encoding maps signed integers to unsigne
protocol-buffers - Protocol Buffer - 唯一编号标签 - 澄清？
我正在使用 Protocol Buffer ，一切正常。除了我不明白的事实 - 为什么我需要 proto 中的编号标签文件 : message SearchRequest { required s
protocol-buffers - 如何设计 Protocol Buffer 中将来的附加枚举值？
Protocol Buffer 的吸引人的功能之一是它允许您扩展消息定义，而不会破坏使用较旧定义的代码。对于枚举according to the documentation: a field with

首页

博学

6Ren·AI

商城

c++ - Protocol Buffer ParseFromString 不检查消息结尾