c++ - 是否可以使用 Varint32 大小前缀的 Protocol Buffer 消息实现类似 'FileInputStream::BackUp()' 的功能？-6ren

c++ - 是否可以使用 Varint32 大小前缀的 Protocol Buffer 消息实现类似 'FileInputStream::BackUp()' 的功能？

转载作者：行者123 更新时间：2023-11-28 06:04:01

25

4

我正在尝试使用 following implementation 在 C++ 中解析带分隔符的 protobuf 消息(来自文件) readDelimitedFrom() - 也复制如下:

bool readDelimitedFrom(
    google::protobuf::io::ZeroCopyInputStream* rawInput,
    google::protobuf::MessageLite* message) {
  // We create a new coded stream for each message.  Don't worry, this is fast,
  // and it makes sure the 64MB total size limit is imposed per-message rather
  // than on the whole stream.  (See the CodedInputStream interface for more
  // info on this limit.)
  google::protobuf::io::CodedInputStream input(rawInput);

  // Read the size.
  uint32_t size;
  if (!input.ReadVarint32(&size)) return false;

  // Tell the stream not to read beyond that size.
  google::protobuf::io::CodedInputStream::Limit limit =
      input.PushLimit(size);

  // Parse the message.
  if (!message->MergeFromCodedStream(&input)) return false;
  if (!input.ConsumedEntireMessage()) return false;

  // Release the limit.
  input.PopLimit(limit);

  return true;
}

我的问题是我需要根据消息中包含的 uint32_t 字段对消息进行分组并分批处理它们 - 我们称它为 id。

目前，我的主循环中有以下代码:

...
int infd = -1;
_sopen_s(&infd, argv[1], _O_RDONLY | _O_BINARY, _SH_DENYWR, _S_IREAD);

google::protobuf::io::ZeroCopyInputStream *input = 
    new google::protobuf::io::FileInputStream(infd);

std::vector<ProtoMessage> msgList;
bool readMore = true;

do {
    ProtoMessage msg;
    readMore = readNextMessage(input, msg, msgList);

    if (!msgList.empty()) {
        std::cout << "Processing Message Batch - ID: " << msgList[0].id();
        /* some processing done here */
    }
} while (readMore);

readNextMessage()的实现如下:

bool readNextMessage(
    google::protobuf::io::ZeroCopyInputStream* rawInput,
    ProtoMessage& nextMsg,
    std::vector<ProtoMessage>& batchList) {

    bool sameBatch = false;
    uint32_t msgID = 0;
    do {
        if (readDelimitedFrom(rawInput, &scan) == -1)
            return false;
        if (nextMsg.id() == 0)
            msgID = nextMsg.id();    // guaranteed to be non-zero
        if (sameBatch = (msgID == nextMsg.id()))
            batchList.push_back(nextMsg); 
    } while (sameBatch); 

    // need a way to roll-back here as nextMsg is now the first new
    // ProtoMessage belonging to a new batch.

    return true;
}

这个函数的逻辑相当简单:获取一个 ZeroCopyInputStream 并使用 readDelimitedFrom() 解析它以将 ProtoMessage 消息分组到一个 vector 中基于他们的 id 字段。如果遇到具有新 ID 的消息，则停止并将控制返回给 main 以处理消息批处理。

这导致了非期望的要求，即必须使用/读取第一条消息(包括其 Varint32 编码的大小)不属于前一批，而没有办法“备份”溪流。我希望能够将 ZeroCopyInputStream 指向最后一个 readDelimitedFrom() 之前的位置。

有什么方法可以修改readDelimitedFrom()使其也返回调用时消耗的字节数，然后在ZeroCopyInputStream上使用指针运算来实现所需的功能？

提供的函数 ZeroCopyInputStream::Backup() 有一个先决条件，即 ZeroCopyInputStream::Next() 是最后一个方法调用。显然，使用 CodedInputStream 包装器解析分隔消息时情况并非如此。

最佳答案

ZeroCopyInputStream::Backup() 只能备份接收到的最后一个缓冲区。一条消息可能跨越多个缓冲区，因此在给定 ZeroCopyInputStream 接口(interface)的情况下，没有通用的方法来执行您想要的操作。

一些选项:

在解析每条消息之前调用rawInput->ByteCount()，以便准确确定消息开始的字节位置。如果您需要回滚，请向后查找底层文件并在其之上重新创建 ZeroCopyInputStream。当然，这只有在您从文件中读取时才有效。
当您在新的批处理中遇到一条消息时，将其保存到一边，然后在来电者要求开始阅读下一批处理时将其取回。

关于c++ - 是否可以使用 Varint32 大小前缀的 Protocol Buffer 消息实现类似 'FileInputStream::BackUp()' 的功能？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32747013/

25

4

0

文章推荐： php - Magento - 出生日期文本位于 3 个文本字段之上

文章推荐： javascript - 有没有办法用 jquery 改变一个类的属性？

文章推荐： c++ - 删除函数 - 基于数组的列表

protocols - 无状态协议(protocol)是否被认为比有状态协议(protocol)更好用？
我可以看到有状态的协议(protocol)可以减少像 cookie 这样的“模拟状态”。但是测试变得更加难以确保您的实现正确并重新连接，并且 session 继续可能很难处理。始终使用无状态协议(
protocols - 通用二进制协议(protocol)
我正在尝试为我的下一个分布式应用程序找到合适的协议(protocol)中间件。在过去的几天里，我找到了几个规范，想知道我是否错过了一个重要的规范？它应该是二进制协议(protocol)，支持 RPC，
protocols - 我在哪里可以找到自动柜员机使用的交易协议(protocol)？
我正在做一个研究生院软件工程项目，我正在寻找管理 ATM 和银行网络之间通信的协议(protocol)。我已经在谷歌上搜索了很长一段时间，虽然我找到了各种有关 ATM 的有趣信息，但我惊讶地发现似乎
protocol-buffers - 如何使用 Protocol Buffers 构建第三方串行通信协议(protocol)？
我正在开发一个 ECG 模块，它以字节为单位给出数据。有一个关于它的协议(protocol)文档解释了如何构建从模块中出来的数据包。我想解码该数据。我很困惑 Protocol Buffer 是否会对此
network-protocols - 面向消息的协议(protocol)和面向流的协议(protocol)之间的区别
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。想改进这个问题？将问题更新为 on-topic对于堆栈溢出。 3年前关闭。 Improve this qu
protocols - 理解ZMODEM协议(protocol)
我需要在我的程序中包含基本的文件发送和文件接收例程，并且需要通过 ZMODEM 协议(protocol)。问题是我无法理解规范。供引用，here is the specification . 规范没
protocols - 什么是联合协议(protocol)？
我最近听到这个术语来描述 Google 的新环聊协议(protocol)和 Whisper System 的新 encrypted texting app . The new TextSecure p
ios7 - 内容协议(protocol)。协议(protocol)不可转换为协议(protocol)
如何检查某个对象是否符合协议(protocol)？我试过这种方式，但出现错误: if lCell.conformsToProtocol(ContentProtocol) { } 最佳
ios - 协议(protocol)类型不能符合协议(protocol)，因为只有具体类型才能符合协议(protocol)
在应用程序中，我们有两种类型的贴纸，字符串和位图。每个贴纸包都可以包含两种类型。这就是我声明模型的方式: // Mark: - Models protocol Sticker: Codable { }
swift - 无法使用另一个符合协议(protocol)的协议(protocol)来符合协议(protocol)
这个问题在这里已经有了答案: Why can't a get-only property requirement in a protocol be satisfied by a property w
swift - 不支持使用 'Protocol' 作为符合协议(protocol) 'Protocol' 的具体类型
我有以下快速代码: protocol Animal { var name: String { get } } struct Bird: Animal { var name: String
iphone - 协议(protocol)中的协议(protocol)是否可以被视为包含它们采用的协议(protocol)？
我在遵循继承树的几个类中分配协议(protocol)。像这样: 头等舱 @protocol LevelOne - (void) functionA @end @interface BaseClass
fix-protocol - OUCH 协议(protocol)和 FIX 协议(protocol)有什么区别。两种协议(protocol)的消息看起来非常相似
我们之前使用的是 fix，但客户说使用 OUCH 进行交易，因为这样速度更快。我在互联网上查了一下，消息看起来很相似。它如何获得速度优势。请给我一些示例消息最佳答案基本上，FIX 消息以文本格式传
swift - 如何使协议(protocol)关联类型需要协议(protocol)继承而不是协议(protocol)采用
在我的 swift 项目中，我有一个使用协议(protocol)继承的案例，如下所示 protocol A : class{ } protocol B : A{ } 接下来我要实现的目标是声明另一个具
protocols - OPC UA 协议(protocol)与 MQTT 协议(protocol)
我想根据这两种协议(protocol)的一般特征(例如开销(数据包)、安全性、信息建模和可靠性)来比较 OPC UA 和 MQTT。我在哪里可以找到每个协议(protocol)的开销和其他特性的一些示
ios - 如何使一个协议(protocol)具有另一个协议(protocol)的属性，同时确保可以限制符合第一个协议(protocol)的类
本质上，我的最终目标是拥有一个协议(protocol) Log，它强制所有符合它的对象都有一个符合另一个协议(protocol) [LogEvent] 的对象数组. 但是，符合Log的类需要有特定类型
ios - 如何根据实现该协议(protocol)的两个实例的身份为协议(protocol)实现 Equatable 协议(protocol)？
我正在尝试为基于左操作数和右操作数标识的协议(protocol)实现 Equatable 协议(protocol)。换句话说:我如何为一个协议(protocol)实现 Equatable 协议(pro
protocols - smb协议(protocol)漏洞解决方案
问题不在于编程。我正在使用一台旧机器，微软停止了这些机器的补丁。有没有人针对攻击者已知的使用端口 445 的 SMB 协议(protocol)漏洞的解决方案？任何棘手的解决方案？换句话说，我想
protocols - Protocol Buffer 日志记录
在我们的业务中，我们需要记录到达我们服务器的每个请求/响应。目前，我们使用 xml 作为标准实现。如果我们需要调试/跟踪某些错误，则使用日志文件。如果我们切换到 Protocol Buffer
protocols - 协议(protocol)定义语言
你推荐什么协议(protocol)定义？我评估了 Google 的 Protocol Buffer ，但它不允许我控制正在构建的数据包中字段的位置。我认为 Thrift 也是如此。我的要求是: 指定

首页

博学

6Ren·AI

商城

c++ - 是否可以使用 Varint32 大小前缀的 Protocol Buffer 消息实现类似 'FileInputStream::BackUp()' 的功能？