c++ - 递归 Spirit.Qi 语法的段错误-6ren

c++ - 递归 Spirit.Qi 语法的段错误

转载作者：行者123 更新时间：2023-11-30 02:41:41

26

4

我正在尝试为一种只包含数字和数学表达式的非常简单的语言创建一个非常简单的解析器。最终我计划扩展它，但直到我可以使这些基本版本正常工作。

我已经成功解析:

没问题。但是我想让它递归，比方说，像这样解析输入:

1 + 2 - 3

我开始出现段错误。我已经对递归语法和段错误进行了一些谷歌搜索，但我似乎无法将我发现的任何东西应用到这个语法上来使其工作。这要么是因为它们不适合我的情况，要么是我未能正确理解我的气语法发生了什么。

我的语法由以下结构组成(包括融合改编):

namespace fun_lang {
    namespace qi = boost::spirit::qi;
    namespace ascii = boost::spirit::ascii;
    namespace phoenix = boost::phoenix;
    namespace fusion = boost::fusion;

    struct number_node {
        long value;
    };

    struct operation_node;

    typedef boost::variant<
        boost::recursive_wrapper<operation_node>,
        number_node
    > node;

    struct operation_node {
        node left, right;
        char op;
    };

    struct program {
        std::vector<node> nodes;
    };
}

BOOST_FUSION_ADAPT_STRUCT(fun_lang::program, (std::vector<fun_lang::node>, nodes));
BOOST_FUSION_ADAPT_STRUCT(fun_lang::number_node, (long, value));
BOOST_FUSION_ADAPT_STRUCT(fun_lang::operation_node, (fun_lang::node, left) (char, op) (fun_lang::node, right));

namespace fun_lang {
    template <typename Iterator, typename Skipper>
    struct fun_grammar : qi::grammar<Iterator, program(), Skipper> {
        fun_grammar() : fun_grammar::base_type(start) {
            using ascii::char_;
            using qi::ulong_;
            using qi::_val;
            using qi::_1;

            using phoenix::push_back;
            using phoenix::at_c;

            expression = (integer | operation)[_val = _1];

            oper = (char_('+') | char_('-') | char_('*') | char_('/'))[_val = _1];
            integer = ulong_[at_c<0>(_val) = _1];

            operation = expression[at_c<0>(_val) = _1] >> oper[at_c<1>(_val) = _1] >> expression[at_c<2>(_val) = _1];

            start = *expression[push_back(at_c<0>(_val), _1)];
        }

        qi::rule<Iterator, program(), Skipper> start;
        qi::rule<Iterator, number_node(), Skipper> integer;
        qi::rule<Iterator, char(), Skipper> oper;
        qi::rule<Iterator, node(), Skipper> expression;
        qi::rule<Iterator, operation_node(), Skipper> operation;
    };
}

一些规则结构基于我为另一种语言编写的 yacc 语法，我将其用作构建这些规则的方式的引用。我不确定是什么导致了段错误，但我知道在运行它时我收到了什么。我试过简化规则，删除一些中间规则，并测试非递归方法。任何非递归的东西似乎都有效，但我见过很多使用递归规则的 Spirit 成功的例子，所以我觉得我不太理解如何表达这些规则。

编辑

为了帮助解决问题，您可以在 ideone 上找到几乎完全相同的拷贝。 . ideone 版本和我在本地拥有的版本之间的唯一区别是，它不是读取文件，而是直接从标准输入中提取文件。

最佳答案

堆栈溢出有两个来源(以段错误结束)。一个是 operation_node 的构造函数和 node . boost::variant ，当默认构造时，使用其第一个模板参数的默认构造对象进行初始化。这是 boost::recursive_wrapper<operation_node> , 它构造了一个 operation_node , 它构造了两个 node s，构造一个boost::recursive_wrapper<operation_node> ，这一直持续到堆栈耗尽。

通常将精神语法中的变体赋予 nil 类型，如 struct nil { };作为防止这种情况发生的第一个论点，并有办法识别未初始化的变体，所以

struct nil { };

typedef boost::variant<
    nil,
    boost::recursive_wrapper<operation_node>,
    number_node
> node;

会解决这个问题。如果你不想使用 nil类型，

typedef boost::variant<
    number_node,
    boost::recursive_wrapper<operation_node>
> node;

也适用于您的情况，因为 number_node可以毫无问题地构建。

另一个堆栈溢出是因为 Boost.Spirit 生成 LL(inf) 解析器(与生成 LALR(1) 解析器的 yacc 相反)，这意味着你得到的是一个递归下降解析器。规则

expression = (integer | operation)[_val = _1];
operation = expression[at_c<0>(_val) = _1] >> oper[at_c<1>(_val) = _1] >> expression[at_c<2>(_val) = _1];

生成一个从operation 派生的解析器进入expression然后回到operation不消耗任何输入。这会递归直到堆栈溢出，这就是您遇到其他段错误的地方。

如果重新制定规则 operation作为

operation = integer[at_c<0>(_val) = _1] >> oper[at_c<1>(_val) = _1] >> expression[at_c<2>(_val) = _1];

这个问题消失了。此外，您必须重写 expression规则为

expression = (operation | integer)[_val = _1];

为了使匹配按照我的预期进行，否则 integer部分将在 operation 之前成功匹配有机会被找到，解析器不会回溯，因为它有一个成功的部分匹配。

另请注意，Spirit 解析器是属性化的；您使用的解析器操作在很大程度上是不必要的。可以像这样重写大部分语法:

expression = operation | integer;

oper = char_("-+*/");
integer = ulong_;

operation = integer >> oper >> expression;

关于c++ - 递归 Spirit.Qi 语法的段错误，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27871368/

26

4

0

文章推荐： c++ - 将设置/获取请求映射到 C++ 类/结构更改中

文章推荐： c++ - 符号 T&&..(2 点)是什么意思？

语法
在此处回答的另一个问题中，我发现了以下 JavaScript代码: function _dom_trackActiveElement(evt) { if (evt && evt.target)
语法
if (A == 0) OR (B == 0) 怎么说？最佳答案只是为了讽刺: if (A === 0 || B === 0) 关于语法，我们在Stack Overflow上找到一个类似的问题：
语法
var ret = [] ,xresult = document.evaluate(exp, rootEl, null, X
语法
我一直在寻找一些类似于下例的 JavaScript。有人可以解释一下吗，因为我以前从未见过这样编写的 JavaScript。 “SomethingHere”和冒号代表什么？我习惯于看到函数 myFun
mysql程序: syntax,语法，语法……太难找了
这是我的程序: delimiter // drop procedure if exists migContactToActor; create procedure migContactToActor(
c - 从 icc 获取 Intel 语法 asm 输出，而不是默认的 AT&T 语法？
我遇到了一个问题。我一直在使用 gcc 编译/汇编我的 C 代码一段时间，并且习惯了阅读 Intel 汇编语法。我在生成程序集文件时使用了 -masm=intel 标志。但是最近因为公司迁移，拿到了
语法:自上而下和自下而上的区别？
自上而下和自下而上语法有什么区别？举个例子就太好了。最佳答案首先，语法本身不是自上而下或自下而上的，解析器是(尽管有些语法可以被其中一个解析，但不能被另一个解析)。从实践的角度来看，主要区别在于
AppleScript 语法
我知道这是草率的代码，但它是: display dialog ("Start Screensaver. Please type: matrix, coffee, waffles, star, wate
Java 语法 ": "
这个问题已经有答案了: Giving name to a loop (6 个回答) 已关闭 8 年前。我见过这个字符在 C# 中使用，就像 Java 中的扩展一样，但最近我在代码中发现了这个 loo
在函数中通过指针调用字符串(语法)
我正在尝试编写一个函数来检查字符串是否为回文，但我认为在使用字符串指针时存在一些错误。这段代码有什么问题？ #include #include #define MAX 1000 int IsPalin
Javascript "for"语法
所以在this question我询问了一些 Javascript 是如何被压缩的。问题已得到解答，但以下片段让我非常困惑，以至于我不得不问另一个问题。在这里: for (Y = 0; $ = 'zx
调用函数指针(语法)
假设我有一个接受这些参数的函数。 int create(Ptr * p,void * (*insert)(void *, void *)) { //return something later } 结
C语言未知&语法
这个问题已经有答案了: Bitwise '&' operator (6 个回答) 已关闭 5 年前。我在代码中找到了这个，但我从未遇到过像 & 这样的事情，仅 && if ((code & 1) =
使用继承的c++语法
我在处理继承类及其中的构造函数和方法的语法时遇到了问题。我想实现一个类日期和一个子类 date_ISO，它们将按特定顺序设置给定的日、月、年，并通过一种方法将其写入字符串。我觉得我的基类日期工作正常
MySQL IF THEN AS 语法
我正在尝试通过存储过程填充表，如下所示: SET @resultsCount = (SELECT COUNT(*) FROM tableA); SET @i = 0; WHILE @i THEN
Bash 语法 : What is the "<<"?
谁能解释一下下面代码中的“<<”？ mysql test<
MySQL OR AND 语法
刚刚开始学习 MySQL，这是一个菜鸟问题，也是我在 StackOverflow 上的第一个问题。假设我有 12 个订单状态，我想从其中的 5 个中选择总计。我会使用: SELECT SUM(tot
JavaScript 语法
我的编程背景是在学校学过一点Java。由于某些原因，JavaScript 语法往往让我感到困惑。下面的 JavaScript 代码是一种我不知道如何构成的语法模式: foo.ready = funct
JavaScript 语法 $
我正在阅读 javascript 源代码，并且我以前没有编写过 javascript。我对它的一些语法感到困惑。 $(function () { window.onload=function
JavaScript 语法？
我什至不知道如何命名我想要的东西。那么让我举个例子来解释一下。虽然火狐使用textContent，但其他浏览器支持innerText属性。顺便说一句，如果我使用了错误的术语，请纠正我。无论如何，到目

首页

博学

6Ren·AI

商城

c++ - 递归 Spirit.Qi 语法的段错误