c++ - Boost Spirit Parser 可选表达式求值-6ren

c++ - Boost Spirit Parser 可选表达式求值

转载作者：行者123 更新时间：2023-11-30 01:42:48

我正在尝试从文本文件中解析一行，格式如下:

[int_:] [int_/int_] [(int_, string)] string [string:int_]...

其中 [] 是可选参数，但将包含标签，例如 (":", "(", ") ", "/").最后一种格式是重复格式 "key:value" 组合。例如:

10: 0x1/2 (8, INC) rd API:2 SI:100

当所有参数都可用时，我能够解析整行。但是，如果缺少任何起始可选参数，则解析器将失败。

如何忽略 Boost Spirit 库中的可选参数？ (即跳过将可选变量分配给默认值。)

这些是 qi 语法规则:

quoted_string = lexeme[+(char_ -(lit(' ') | lit(')')))];
hex_num = ((lit("0x") | lit("0X")) >> hex) | uint_;

start = (hex_num >> lit(":"))
    >> (hex_num >> lit("/") >> hex_num )
    >> lit("(") >> hex_num >> lit(",") >> quoted_string >> lit(")")
    >> quoted_string
    >> quoted_string;

qi::rule<Iterator, std::string(), ascii::space_type> quoted_string;
qi::rule<Iterator, uint32_t(), ascii::space_type> hex_num;
qi::rule<Iterator, employee(), ascii::space_type> start;

最佳答案

为您的 AST 节点建模以反射(reflect)解析器树:

struct ratio_t { uint32_t a,b; };
struct opcode_t { uint32_t id; std::string name; };

struct Node {
    uint32_t label; // prefix:

    boost::optional<ratio_t> ratio; // a/b
    boost::optional<opcode_t> opcode; // (id, name)

    std::string extra;
    std::multimap<std::string, uint32_t> params;
};

(随手编造，因为我只能猜测数据的含义。我假设 employee、hex_num 和 quoted_string 不知何故是您开始使用的示例代码的残余)。

现在当你调整这些结构时:

BOOST_FUSION_ADAPT_STRUCT(AST::ratio_t, a, b)
BOOST_FUSION_ADAPT_STRUCT(AST::opcode_t, id, name)
BOOST_FUSION_ADAPT_STRUCT(AST::Node, label, ratio, opcode, extra, params)

您可以使用类似的解析树简单地解析它:

    // lexemes
    unquoted_string = +(graph - ')');
    num = (no_case[ "0x" ] >> hex) | uint_;
    param = +(graph - ':') >> ':' >> num;

    // skipping productions
    opcode = '(' >> num >> ',' >> unquoted_string >> ')';
    ratio  = num >> '/' >> num;
    prefix = (num >> ':') | attr(0);                      // defaults to 0
    start  = prefix
            >> -ratio
            >> -opcode
            >> unquoted_string
            >> *param;

现在当你解析这些测试用例时:

for (std::string const input : {
        "10: 0x1/2 (8, INC) rd API:2 SI:100",
        "10: 0x1/2 (8, INC) rd API:2",
        "10: 0x1/2 (8, INC) rd",
        "10: 0x1/2 rd API:2 SI:100",
        "10: rd API:2 SI:100",
        "0x1/2 rd API:2 SI:100",
        "rd API:2 SI:100",
    })
{
    It f = input.begin(), l = input.end();
    AST::Node data;
    bool ok = qi::phrase_parse(f, l, p, qi::ascii::space, data);
    if (ok) {
        std::cout << "Parse success: " << data << "\n";
    }
    else {
        std::cout << "Parse failure ('" <<  input << "')\n";
    }

    if (f!=l) {
        std::cout << "Remaining unparsed input: '" << std::string(f,l) << "'\n";
    }
}

你得到:

Parse success: 10:  1/2  (8, 'INC') rd API:2 SI:100
Parse success: 10:  1/2  (8, 'INC') rd API:2
Parse success: 10:  1/2  (8, 'INC') rd
Parse success: 10:  1/2 -- rd API:2 SI:100
Parse success: 10: -- -- rd API:2 SI:100
Parse success: 0:  1/2 -- rd API:2 SI:100
Parse success: 0: -- -- rd API:2 SI:100

完整演示

Live On Coliru

#include <boost/spirit/include/qi.hpp>
#include <boost/fusion/adapted.hpp>
#include <boost/optional/optional_io.hpp>
#include <map>

namespace qi = boost::spirit::qi;

namespace AST {
    struct ratio_t  { uint32_t a,b; };
    struct opcode_t { uint32_t id; std::string name; };

    struct Node {
        uint32_t label; // prefix:

        boost::optional<ratio_t> ratio; // a/b
        boost::optional<opcode_t> opcode; // (id, name)

        std::string extra;
        std::multimap<std::string, uint32_t> params;
    };

    std::ostream& operator<<(std::ostream& os, ratio_t const& v) {
        return os << v.a << "/" << v.b;
    }
    std::ostream& operator<<(std::ostream& os, opcode_t const& v) {
        return os << "(" << v.id << ", '" << v.name << "')";
    }
    std::ostream& operator<<(std::ostream& os, Node const& v) {
        os << v.label << ": " << v.ratio << " " << v.opcode << " " << v.extra;
        for (auto& p : v.params) os << " " << p.first << ":" << p.second;
        return os;
    }
}

BOOST_FUSION_ADAPT_STRUCT(AST::ratio_t, a, b)
BOOST_FUSION_ADAPT_STRUCT(AST::opcode_t, id, name)
BOOST_FUSION_ADAPT_STRUCT(AST::Node, label, ratio, opcode, extra, params)

template <typename It, typename Skipper = qi::ascii::space_type>
struct P : qi::grammar<It, AST::Node(), Skipper> {
    P() : P::base_type(start) 
    {
        using namespace qi;

        // lexemes
        unquoted_string = +(graph - ')');
        num = (no_case[ "0x" ] >> hex) | uint_;
        param = +(graph - ':') >> ':' >> num;

        // skipping productions
        opcode = '(' >> num >> ',' >> unquoted_string >> ')';
        ratio  = num >> '/' >> num;
        prefix = (num >> ':') | attr(0);                      // defaults to 0
        start  = prefix
                >> -ratio
                >> -opcode
                >> unquoted_string
                >> *param;

        BOOST_SPIRIT_DEBUG_NODES((start)(unquoted_string)(num)(prefix)(ratio)(opcode)(param))
    }

  private:
    qi::rule<It, AST::ratio_t(),  Skipper> ratio;
    qi::rule<It, AST::opcode_t(), Skipper> opcode;
    qi::rule<It, AST::Node(),     Skipper> start;
    qi::rule<It, uint32_t(),      Skipper> prefix;

    //lexemes
    qi::rule<It, std::string()> unquoted_string;
    qi::rule<It, uint32_t()> num;
    qi::rule<It, std::pair<std::string, uint32_t>> param;
};

int main() {
    using It = std::string::const_iterator;
    P<It> const p;

    for (std::string const input : {
            "10: 0x1/2 (8, INC) rd API:2 SI:100",
            "10: 0x1/2 (8, INC) rd API:2",
            "10: 0x1/2 (8, INC) rd",
            "10: 0x1/2 rd API:2 SI:100",
            "10: rd API:2 SI:100",
            "0x1/2 rd API:2 SI:100",
            "rd API:2 SI:100",
        })
    {
        It f = input.begin(), l = input.end();
        AST::Node data;
        bool ok = qi::phrase_parse(f, l, p, qi::ascii::space, data);
        if (ok) {
            std::cout << "Parse success: " << data << "\n";
        }
        else {
            std::cout << "Parse failure ('" <<  input << "')\n";
        }

        if (f!=l) {
            std::cout << "Remaining unparsed input: '" << std::string(f,l) << "'\n";
        }
    }
}

关于c++ - Boost Spirit Parser 可选表达式求值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38796674/

文章推荐： android - 如何在 Fragment 创建后立即显示 AlertDialog

文章推荐： c++ - 这段 C 代码有什么问题？

文章推荐： JavaFX - 文件资源管理器无法在另一个全屏阶段打开

parsing - 创建类型为 Parser a -> Parser b -> Parser (要么 a b)的解析器组合器
我想解析一些文本，其中某些字段在大多数情况下都具有结构，但偶尔(由于特殊大小写、拼写错误等)该结构会丢失。例如常规情况是 Cost: 5，但偶尔会显示 Cost: 5m 或 Cost: 3 + 1
java - parser.setFeature 与 parser.setValidating
以下有什么区别: parser.setFeature("http://xml.org/sax/features/validation",true); and parser.setFeature("ht
node.js - npm 错误! EPROTO : protocol error, 符号链接(symbolic link) '../@babel/parser/bin/babel-parser.js' -> '/home/vagrant/code/proadco.test/node_modules/.bin/parser'
我尝试在 Windows 8.1 上的 Git Bash 客户端中执行 npm install，但收到以下错误: npm WARN optional SKIPPING OPTIONAL DEPENDE
types - 理解这个 elm url-parser Parser 类型声明
试图理解 evancz/url-parser 模块时，我偶然发现了这种我难以理解的类型声明:( source ) type Parser a b = Parser (State a -> List
typescript - ESLint 配置中的 "parser"和 "parserOptions.parser"有什么区别？
我长期使用下面的 TypeScript 和 Vue 预设。它有效，但我还没有理解每个选项，现在要理解它。第一:parser之间有什么区别？和 @typescript-eslint/parser ？ p
javascript - node-sql-parser ， parser.astify(sqlquery) 不返回准确的输出
我正在尝试使用node-sql-parser在nodejs中解析sql查询。 const {Parser} = require('node-sql-parser'); const parser = n
javascript - AgnualrJs - $parsers.unshift 与 $parsers.push 的区别
自定义指令中的 ngModelCtrl.$parsers.unshift 和 ngModelCtrl.$parsers.push 之间的确切区别是什么。当发生对模型生效但对表单本身无效的事情时，我想
java - XML Pull Parser 和 SAX Parser 有什么区别
我正在寻找 SAX 和 Pull Parser 之间的主要区别。我知道 SAX 解析器非常适合处理大型 XML 文件，因为它不存储 XML 并且只在一个方向上遍历。与 DOM 相比。但我无法找到 SA
c++ - 对 QJson::Parser::Parser 的 undefined reference
我已经按照存档中的说明成功(？)安装了 QJson 库。但是编译器给我这个错误: Undefined reference to QJSon::Parser::Parser(). 我找到了安装库文件的位
html - 我应该使用 HTML::Parser 还是 XML::Parser 来提取和替换文本？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，
Java cucumber -java.lang.NoSuchMethodError : gherkin. parser.Parser.parse
尝试实现 Cucumber 来进行一些自动化测试。当我使用 junit 运行测试时，出现以下错误项目路径: src/test/java/ cucumberJava -cucumberjava,ja
node.js - Node Body Parser 和 cookie parser 有什么作用？我应该使用它们吗？
我已经阅读了我能找到的所有文档，但是我找不到关于这两个中间件的作用的简单解释。 body-parser 中的body 指的是什么？为什么需要解析正文？ Cookie 也类似。我是否更正了 cookie
java - Deorg.apache.xerces.parsers.XIncludeAwareParserConfiguration无法转换为org.apache.xerces.xni.parser.XMLParserConfiguration
我在gradle项目中使用Xerces jar，然后在gradle插件中使用该项目的jar:实际上，我正在开发一个gradle插件，其中包含使用gradle项目jar的某些功能的自定义任务；当我尝试运
java - org.apache.commons.net.ftp.parser.ParserInitializationException : Unknown parser type: Linux
我正在尝试连接到 Linux 上的 FTP 服务器，当我执行 ftp.listFiles(remote); 时遇到异常 SYST 215 Linux Exception in thread "AW
reactjs - 创建 react 应用程序-没有 typescript ，得到了错误: Failed to load parser '@typescript-eslint/parser'
我有react-app的示例安装，我得到了以下内容 Error: Failed to load parser '@typescript-eslint/parser' declared in '.esl
java - ClassCastException : org. apache.xerces.parsers.XIncludeAwareParserConfiguration 无法转换为 org.apache.xerces.xni.parser.XMLParserConfiguration
我在 there 中提到过类似的问题.我正在使用 mvn clean compile site 命令，我的版本是: cobertura.version: 2.5.1 findbugs.version:
java - ClassCastException : org. apache.xerces.parsers.XIncludeAwareParserConfiguration 无法转换为 org.apache.xerces.xni.parser.XMLParserConfiguration
我正在 Eclipse 中开发 GWT 应用程序并使用 jdom2 读取一些自定义 xml 属性文件。在最近的更新之后，我的应用程序现在在尝试读取 xml 文件时失败并出现上述错误。相关堆栈跟踪是:
java.lang.IllegalAccessError : class javax. xml.parsers.SecuritySupport12 无法访问其父类(super class) javax.xml.parsers.SecuritySupport
我正在使用 spring+maven。我正在 tomcat 服务器中部署我的应用程序。当我尝试运行我的应用程序时，突然出现以下错误。 INFO: Starting Servlet Engine: Ap
python - 使用 "import dateutil"和 "dateutil.parser.parse()"时出现 AttributeError 但使用 "from dateutil import parser"时没有问题
我在玩dateutil module在 Python 2.7.3 中。我只是想使用: import dateutil dateutil.parser.parse("01-02-2013") 但我得到了
Python基于argparse与ConfigParser库进行入参解析与ini parser
一.入参解析库 argparse 　　有时候写Python脚本，需要处理入参[-h][-v][-F]...等情况，如果自己来解析的话，会花费很多时间，而且也容易出问题，好在Python有现成的li

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

c++ - Boost Spirit Parser 可选表达式求值

完整演示