c++ - 使用精神以替代方式解析结构时混淆输出-6ren

c++ - 使用精神以替代方式解析结构时混淆输出

转载作者：塔克拉玛干更新时间：2023-11-03 02:08:52

这是我尝试以尽可能最好的方式做的事情的一个大大减少的案例。 (当然，问题还在于，我试图了解如何最好地使用精神。)

我需要将数据解析为具有多个成员的结构。成员被简单地列为键值对，因此这很简单——但是，如果某些键不同，那么在我正在解析的数据中，不同的值可能会稍后出现，或者某些键可能会被省略。尽管如此，我最终解析的数据结构是有固定形式的。

在示例代码中，my_struct是 struct像这样:

struct my_struct {
  std::string a;
  std::string b;
  std::string c;
  std::string d;
};

和grammar1是一个像这样解析字符串的语法

"a: x b: y c: z d: w"

进入这样的结构

my_struct{ "x", "y", "z", "w" }

我还想像这样解析字符串:

"a: x b: y d-no-c: w"

进入这样的结构

my_struct{ "x", "y", "", "w" }

理想情况下，我希望以尽可能简单的方式完成此操作，而不会在此过程中制作不必要的字符串拷贝。

我的第一个想法是，应该重写主要规则，以便它解析“a”和“b”，然后根据“c”是否存在在两个备选方案之间进行选择。这作为一个语法很容易解决，但是当我们试图为它的属性语法部分获取正确的数据类型时，我似乎无法让它工作。我尝试使用 std::pair<std::string, std::string>还有fusion::vector对于替代类型，但这显然不能使用 qi 流式传输到我的结构中运算符(operator) << . (grammar2 测试被注释掉，因为它无法编译。)

我的下一个想法是，我们可以简单地有两种主要规则的替代形式，它们的属性类型为 my_struct以确保属性解析有效。令人惊讶的是，这个实现实际上被破坏了——似乎当语法回溯时，它复制了 a。和 b结果结构中的字段。我没想到会这样，我也不知道为什么会这样，你知道吗？ (这是 grammar3 )。

grammar3有一个问题，即使它像我认为的那样工作(测试通过)，当替代部分回溯时，它也必须重新解析 a和 b这是一些低效率。如果我们愿意将目标结构从 my_struct 更改为到不同的结构，那么我们可以使用 grammar4 ，与grammar2具有相同的计划, 但目标是其中一个元素是 std::pair 的结构.然后我们将所有字符串从这个临时结构中移出，变成我们真正想要的格式。

那么，问题是:

grammar4有效，但是有没有办法按照 grammar2 的方式做一些事情？哪个可能更有效？
为什么 grammar3考试不及格？

完整 list :

#define SPIRIT_USE_PHOENIX_V3
#include <boost/spirit/include/qi.hpp>
#include <boost/spirit/include/phoenix_core.hpp>
#include <boost/spirit/include/phoenix_fusion.hpp>
#include <boost/fusion/include/adapt_struct.hpp>
#include <boost/fusion/adapted/struct/define_struct.hpp>
#include <boost/fusion/include/define_struct.hpp>
#include <boost/fusion/include/std_pair.hpp>

#include <iostream>
#include <string>
#include <utility>

namespace qi = boost::spirit::qi;

BOOST_FUSION_DEFINE_STRUCT(
 /**/
 ,
 my_struct,
 (std::string, a)
 (std::string, b)
 (std::string, c)
 (std::string, d))

template<typename Iterator>
class grammar1 : public qi::grammar<Iterator, my_struct()> {
public:
  qi::rule<Iterator, std::string()> id;
  qi::rule<Iterator, my_struct()> main;

  grammar1() : grammar1::base_type(main) {
    using qi::lit;
    using qi::char_;
    using qi::omit;
    using qi::space;
    id = omit[ *space ] >> *char_("A-Za-z_") >> omit [ *space ];
    main = lit("a:") >> id >> lit("b:") >> id >> lit("c:") >> id >> lit("d:") >> id;
  }
};


//typedef std::pair<std::string, std::string> second_part_type;
typedef boost::fusion::vector<std::string, std::string> second_part_type;

template<typename Iterator>
class grammar2 : public qi::grammar<Iterator, my_struct()> {
public:
  qi::rule<Iterator, std::string()> id;
  qi::rule<Iterator, second_part_type()> with_c;
  qi::rule<Iterator, second_part_type()> without_c;
  qi::rule<Iterator, my_struct()> main;

  grammar2() : grammar2::base_type(main) {
    using qi::lit;
    using qi::char_;
    using qi::omit;
    using qi::space;
    using qi::attr;
    id = omit[ *space ] >> *char_("A-Za-z_") >> omit [ *space ];
    with_c = lit("c:") >> id >> lit("d:") >> id;
    without_c = attr("") >> lit("d-no-c:") >> id;
    main = lit("a:") >> id >> lit("b:") >> id >> (with_c  | without_c);
  }
};


template<typename Iterator>
class grammar3 : public qi::grammar<Iterator, my_struct()> {
public:
  qi::rule<Iterator, std::string()> id;
  qi::rule<Iterator, my_struct()> with_c;
  qi::rule<Iterator, my_struct()> without_c;
  qi::rule<Iterator, my_struct()> main;

  grammar3() : grammar3::base_type(main) {
    using qi::lit;
    using qi::char_;
    using qi::omit;
    using qi::space;
    using qi::attr;
    id = omit[ *space ] >> *char_("A-Za-z_") >> omit [ *space ];
    with_c = lit("a:") >> id >> lit("b:") >> id >> lit("c:") >> id >> lit("d:") >> id;
    without_c = lit("a:") >> id >> lit("b:") >> id >> attr("") >> lit("d-no-c:") >> id;
    main = with_c | without_c;
  }
};

/***
 * Alternate approach
 */
typedef std::pair<std::string, std::string> spair;

BOOST_FUSION_DEFINE_STRUCT(
 /**/
 ,
 my_struct2,
 (std::string, a)
 (std::string, b)
 (spair, cd))

template<typename Iterator>
class grammar4 : public qi::grammar<Iterator, my_struct2()> {
public:
  qi::rule<Iterator, std::string()> id;
  qi::rule<Iterator, spair()> with_c;
  qi::rule<Iterator, spair()> without_c;
  qi::rule<Iterator, my_struct2()> main;

  grammar4() : grammar4::base_type(main) {
    using qi::lit;
    using qi::char_;
    using qi::omit;
    using qi::space;
    using qi::attr;
    id = omit[ *space ] >> *char_("A-Za-z_") >> omit [ *space ];
    with_c = lit("c:") >> id >> lit("d:") >> id;
    without_c = attr("") >> lit("d-no-c:") >> id;
    main = lit("a:") >> id >> lit("b:") >> id >> (with_c  | without_c);
  }
};

my_struct convert_struct(my_struct2 && s) {
  return { std::move(s.a), std::move(s.b), std::move(s.cd.first), std::move(s.cd.second) };
}

/***
 * Testing
 */
void check_strings_eq(const std::string & a, const std::string & b, const char * label, int line = 0) {
  if (a != b) {
    std::cerr << "Mismatch '" << label << "' ";
    if (line) { std::cerr << "at line " << line << " "; }
    std::cerr << "\"" << a << "\" != \"" << b << "\"\n";
  }
}

void check_eq(const my_struct & s, const my_struct & t, int line = 0) {
  check_strings_eq(s.a, t.a, "a", line);
  check_strings_eq(s.b, t.b, "b", line);
  check_strings_eq(s.c, t.c, "c", line);
  check_strings_eq(s.d, t.d, "d", line);
}

template<template<typename> class Grammar>
void test_grammar(const std::string & input, const my_struct & expected, int line = 0) {
  auto it = input.begin();
  auto end = input.end();
  Grammar<decltype(it)> grammar;
  my_struct result;
  if (!qi::parse(it, end, grammar, result)) {
    std::cerr << "Failed to parse! ";
    if (line) { std::cerr << "line = " << line; }
    std::cerr << "\n";
    std::cerr << "Stopped at:\n" << input << "\n";
    for (auto temp = input.begin(); temp != it; ++temp) { std::cerr << " "; }
    std::cerr << "^\n";
  } else {
    check_eq(result, expected, line);
  }
}

int main() {
  test_grammar<grammar1> ( "a: x    b: y   c: z   d: w",   my_struct{ "x",    "y",   "z",   "w" }, __LINE__);
  test_grammar<grammar1> ( "a: asdf b: jkl c: foo d: bar", my_struct{ "asdf", "jkl", "foo", "bar" }, __LINE__ );
  //test_grammar<grammar2> ( "a: asdf b: jkl c: foo d: bar", my_struct{ "asdf", "jkl", "foo", "bar" }, __LINE__ );
  //test_grammar<grammar2> ( "a: asdf b: jkl d-no-c: bar",   my_struct{ "asdf", "jkl", "", "bar" }, __LINE__ );
  test_grammar<grammar3> ( "a: asdf b: jkl c: foo d: bar", my_struct{ "asdf", "jkl", "foo", "bar" }, __LINE__);
  test_grammar<grammar3> ( "a: asdf b: jkl d-no-c: bar",   my_struct{ "asdf", "jkl", "", "bar" }, __LINE__ );

  // Test 4th grammar
  {
    std::string input = "a: asdf b: jkl c: foo d: bar";
    auto it = input.begin();
    auto end = input.end();
    grammar4<decltype(it)> grammar;
    my_struct2 result;
    if (!qi::parse(it, end, grammar, result)) {
      std::cerr << "Failed to parse! Line = " << __LINE__ << std::endl;
    } else {
      check_eq(convert_struct(std::move(result)),  my_struct{ "asdf", "jkl", "foo", "bar" }, __LINE__);
    }
  }
  {
    std::string input = "a: asdf b: jkl d-no-c: bar";
    auto it = input.begin();
    auto end = input.end();
    grammar4<decltype(it)> grammar;
    my_struct2 result;
    if (!qi::parse(it, end, grammar, result)) {
      std::cerr << "Failed to parse! Line = " << __LINE__ << std::endl;
    } else {
      check_eq(convert_struct(std::move(result)),  my_struct{ "asdf", "jkl", "", "bar" }, __LINE__);
    }
  }
}

最佳答案

我的建议是确实使用置换解析器。

虽然它更加灵活，因此您可能希望在语义操作中添加验证约束:

Live On Coliru

//#define BOOST_SPIRIT_DEBUG
#include <boost/spirit/include/qi.hpp>
#include <boost/spirit/include/phoenix.hpp>
#include <boost/fusion/include/adapt_struct.hpp>
#include <boost/tuple/tuple_comparison.hpp>

#include <iostream>
#include <string>

namespace qi = boost::spirit::qi;

struct my_struct {
    std::string a,b,c,d;
};

BOOST_FUSION_ADAPT_STRUCT(my_struct, a, b, c, d)

template<typename Iterator>
class grammar : public qi::grammar<Iterator, my_struct()> {
    public:
        grammar() : grammar::base_type(start) {
            using namespace qi;

            id    = +char_("A-Za-z_");
            part  = lexeme[lit(_r1) >> ':'] >> id;

            main  = part(+"a")
                  ^ part(+"b")
                  ^ part(+"c")
                  ^ (part(+"d") | part(+"d-no-c"));
                  ;

            start = skip(space) [ main ];

            BOOST_SPIRIT_DEBUG_NODES((main)(part))
        }
    private:
        qi::rule<Iterator, std::string()>                            id;
        qi::rule<Iterator, std::string(const char*), qi::space_type> part;
        qi::rule<Iterator, my_struct(), qi::space_type>              main;
        //
        qi::rule<Iterator, my_struct()> start;
};

/***
 * Testing
 */
void check_strings_eq(const std::string & a, const std::string & b, const char * label) {
    if (a != b) {
        std::cerr << "Mismatch '" << label << "' \"" << a << "\" != \"" << b << "\"\n";
    }
}

void check_eq(const my_struct & s, const my_struct & t) {
    check_strings_eq(s.a, t.a, "a");
    check_strings_eq(s.b, t.b, "b");
    check_strings_eq(s.c, t.c, "c");
    check_strings_eq(s.d, t.d, "d");
    if (boost::tie(s.a,s.b,s.c,s.d) == boost::tie(t.a,t.b,t.c,t.d))
        std::cerr << "struct data matches\n";
}

template<template<typename> class Grammar>
void test_grammar(const std::string &input, const my_struct &expected) {
    auto it  = input.begin();
    auto end = input.end();

    Grammar<decltype(it)> grammar;
    my_struct result;

    if (!qi::parse(it, end, grammar, result)) {
        std::cerr << "Failed to parse!\n";
        std::cerr << "Stopped at:\n" << input << "\n";

        for (auto temp = input.begin(); temp != it; ++temp) {
            std::cerr << " ";
        }

        std::cerr << "^\n";
    } else {
        check_eq(result, expected);
    }
}

int main() {
    for (auto&& p : std::vector<std::pair<std::string, my_struct> > {
            {"a: x b: y c: z d: w", my_struct{ "x", "y", "z", "w" }},
            {"a: x      c: z d: w", my_struct{ "x", "" , "z", "w" }},
            {"a: x      c: z"     , my_struct{ "x", "" , "z", ""  }},
            {"     b: y c: z d: w", my_struct{ "" , "y", "z", "w" }},
            {"b: y c: z a: x d: w", my_struct{ "x", "y", "z", "w" }},
            // if you really need:
            {"a: x b: y d-no-c: w", my_struct{ "x", "y", "" , "w" }},
        })
    {
        auto const& input    = p.first;
        auto const& expected = p.second;
        std::cout << "----\nParsing '" << input << "'\n";
        test_grammar<grammar> (input, expected);
    }
}

打印

----
Parsing 'a: x b: y c: z d: w'
struct data matches
----
Parsing 'a: x      c: z d: w'
struct data matches
----
Parsing 'a: x      c: z'
struct data matches
----
Parsing '     b: y c: z d: w'
struct data matches
----
Parsing 'b: y c: z a: x d: w'
struct data matches
----
Parsing 'a: x b: y d-no-c: w'
struct data matches

关于c++ - 使用精神以替代方式解析结构时混淆输出，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33337623/

文章推荐： c++ - 为什么模板化的右值引用接受左值？

文章推荐： linux - 将使用 "-g"编译的二进制文件与没有 "-g"的库链接

文章推荐： linux - 在将一个方法的输出发送到另一个之前传递和修改它

文章推荐： c++ - Cereal 不支持原始指针

mysql - 从 bash 输出 sql 输出
我正在使用 OUTFILE 命令，但由于权限问题和安全风险，我想将 shell 的输出转储到文件中，但出现了一些错误。我试过的 #This is a simple shell to connect t
JAVA——程序功能为输入输出、输入输出；想让程序的功能分别为输入输入、输出、输出
我刚刚开始学习 Java，我想克服在尝试为这个“问题”创建 Java 程序时出现的障碍。这是我必须创建一个程序来解决的问题: Tandy 喜欢分发糖果，但只有 n 颗糖果。对于她给第 i 个糖果的人，
c++ - 无法使用 ostream 输出 C++ 输出 vector
你好，我想知道我是否可以得到一些帮助来解决我在 C++ 中打印出 vector 内容的问题我试图以特定顺序在一个或两个函数调用中输出一个类的所有变量。但是我在遍历 vector 时收到一个奇怪的错误
gradle - 重复生成的类 gradle 输出 (build/...) 与 intellij 输出 (out/...)
我正在将 intellij (2019.1.1) 用于 java gradle (5.4.1) 项目，并使用 lombok (1.18.6) 来自动生成代码。 Intellij 将生成的源放在 out
javascript - 如何从 JavaScript 输出 JSON 输出，以便将其识别为 JSON？
编辑:在与 guest271314 交流后，我意识到问题的措辞(在我的问题正文中)可能具有误导性。我保留了旧版本并更好地改写了新版本背景: 从远程服务器获取 JSON 时，响应 header 包含一
java - StoredProcedureCall 1x Varchar 输出 1x Cursor 输出
我的问题可能有点令人困惑。我遇到的问题是我正在使用来自 Java 的 StoredProcedureCall 调用过程，例如: StoredProcedureCall call = new Store
com - COM IDL定义中[输入，输出]和[输出，检索]之间的差异
在我使用的一些IDL中，我注意到在方法中标记返回值有2个约定-[in, out]和[out, retval]。当存在多个返回值时，似乎使用了[in, out]，例如: HRESULT MyMetho
linux - 我如何告诉 `gar` 或 `ar` 输出 `elf32-i386` 输出？
当我查看 gar -h 的帮助输出时，它告诉我: [...] gar: supported targets: elf64-x86-64 elf32-i386 a.out-i386-linux [...
r - Knitr HTML Loop - 一些 HTML 输出，一些 R 输出
我想循环遍历一个列表，并以 HTML 格式打印其中的一部分，以代码格式打印其中的一部分。所以更准确地说:我想产生与这相同的输出 1 is a great number 2 is a great
"Error running git [init /workspace/output/]: exit status 1\n/workspace/output/.git: Permission denied\n"(“运行git[init/工作区/输出/]时出错：退出状态1\n/工作区/输出/.git：权限被拒绝\n”)
我有下面的tekton管道，并尝试在Google Cloud上运行。集群角色绑定。集群角色。该服务帐户具有以下权限。。例外。不确定需要为服务帐户设置什么权限。
Grepping 输出
当尝试从 make 过滤非常长的输出以获取特定警告或错误消息时，第一个想法是这样的: $ make | grep -i 'warning: someone set up us the bomb' 然而
Kotlin中抽象容器工具的泛型输入/输出？
我正在创建一个抽象工具类，该类对另一组外部类(不受我控制)进行操作。外部类在某些接口(interface)点概念上相似，但访问它们相似属性的语法不同。它们还具有不同的语法来应用工具操作的结果。我创建了
Python奇怪的按位与(&)输出
这个问题已经有答案了: What do numbers starting with 0 mean in python? (9 个回答) 已关闭 7 年前。在我的代码中使用按位与运算符 (&) 时，我
Python文件输入/输出
我写了这段代码来解析输入文件中的行输入格式:电影 ID 可以有多个条目，所以我们应该计算平均值输出:**没有重复(这是问题所在) import re f = open("ratings2.txt",
更高效的Python输入/输出
我需要处理超过 1000 万个光谱数据集。数据结构如下:大约有 1000 个 .fits(.fits 是某种数据存储格式)文件，每个文件包含大约 600-1000 个光谱，其中每个光谱中有大约 450
C编程频率计数器输入/输出
我编写了一个简单的 C 程序，它读取一个文件并生成一个包含每个单词及其出现频率的表格。该程序有效，我已经能够在 Linux 上运行的终端中获得显示的输出，但是，我不确定如何获得生成的显示以生成包含词
C语言音频输入/输出
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 1
python中的print()输出
1.普通的输出： print(str)#str是任意一个字符串，数字··· 2.格式化输出： ?
logstash 简单文件输入/输出
我无法让 logstash 正常工作。 Basic logstash Example作品。但后来我与 Advanced Pipeline Example 作斗争.也许这也可能是 Elasticsear
audio - 快速音频输入/输出
这是我想要做的: 我想让用户给我的程序一些声音数据(通过麦克风输入)，然后保持 250 毫秒，然后通过扬声器输出。我已经使用 Java Sound API 做到了这一点。问题是它有点慢。从发出声音到

塔克拉玛干

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

c++ - 使用精神以替代方式解析结构时混淆输出