gpt4 book ai didi

c++ - 我可以使用 JsonCpp 部分验证 JSON 输入吗?

转载 作者:搜寻专家 更新时间:2023-10-31 00:18:56 24 4
gpt4 key购买 nike

我正在使用 JsonCpp在 C++ 中解析 JSON。

例如

Json::Reader r;
std::stringstream ss;
ss << "{\"name\": \"sample\"}";

Json::Value v;
assert(r.parse(ss, v)); // OK
assert(v["name"] == "sample"); // OK

但我的实际输入是一个完整的 JSON 消息,它们可能以任意大小的 block 形式到达;我所能做的就是让 JsonCpp 尝试逐个字符地解析我的输入,在我们发现它们时吃掉完整的 JSON 消息:

Json::Reader r;
std::string input = "{\"name\": \"sample\"}{\"name\": \"aardvark\"}";

for (size_t cursor = 0; cursor < input.size(); cursor++) {
std::stringstream ss;
ss << input.substr(0, cursor);

Json::Value v;
if (r.parse(ss, v)) {
std::cout << v["name"] << " ";
input.erase(0, cursor);
}
} // Output: sample aardvark

这已经有点令人讨厌了,但确实会变得更糟。我还需要能够在部分输入丢失(出于任何原因)时重新同步。

现在它不必是无损的,但我想防止像下面这样的输入永远破坏解析器:

{"name": "samp{"name": "aardvark"}

将此输入传递给 JsonCpp 会失败,但随着我们在缓冲区中接收到更多字符,该问题不会消失;第二个 name 在它之前的 " 之后直接无效;缓冲区永远无法完成以呈现有效的 JSON。

但是,如果有人告诉我该片段在第二个 n 字符后肯定会变得无效,那么我可以将缓冲区中的所有内容都丢弃到该点,然后只需等待下一个 { 考虑新对象的开始,作为尽力而为的重新同步。


那么,有没有一种方法可以让 JsonCpp 告诉我一个不完整的 JSON 片段是否已经保证完整的“对象”在语法上是无效的?

即:

{"name": "sample"}   Valid        (Json::Reader::parse == true)
{"name": "sam Incomplete (Json::Reader::parse == false)
{"name": "sam"LOL Invalid (Json::Reader::parse == false)

我想区分这两种失败状态。

我可以使用 JsonCpp 来实现这一点,还是我必须通过构建一个状态机来编写自己的 JSON“部分验证器”,该状态机在输入字符串的每一步都考虑哪些字符是“有效的”?我宁愿不重新发明轮子...

最佳答案

这当然取决于您是否真的控制了数据包(以及生产者)。如果这样做,最简单的方法是在标题中指示边界:

+---+---+---+---+-----------------------
| 3 | 16|132|243|endofprevious"}{"name":...
+---+---+---+---+-----------------------

标题很简单:

  • 3表示分界数
  • 16、132、243表示每条边界的位置,对应新对象(或列表)的左括号

然后是缓冲区本身。

收到这样的数据包后,可以解析以下条目:

  • previous + current[0:16]
  • current[16:132]
  • current[132:243]

current[243:]为下一个数据包保存(尽管您始终可以尝试解析它以防它已完成)。

这样,数据包是自动同步的,没有模糊检测,所有失败情况都是如此。

请注意,可能有 0数据包中的边界。它只是意味着一个对象大到足以跨越多个数据包,您只需要暂时积累。

我会建议使数字表示“固定”(例如,每个 4 个字节)并确定字节顺序(您机器的字节顺序)以便轻松地将它们转换为二进制或从二进制转换。我相信开销相当小(鉴于 {"name":""} 已经是 11 个字节,每个条目 4 个字节 + 4 个字节)。

关于c++ - 我可以使用 JsonCpp 部分验证 JSON 输入吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9270146/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com