gpt4 book ai didi

c++ - 在 boost::spirit 中正确设置 expectation_failure 的跨度

转载 作者:行者123 更新时间:2023-11-30 03:22:10 24 4
gpt4 key购买 nike

我正在尝试向我的解析器添加错误报告,但我不知道如何针对特定规则正确执行此操作。

有问题的规则匹配 mag(12.5)sqrt(5.38) 形式的函数调用。有一个固定的函数名称列表,每个函数都可以以不同于其他函数的方式解析其参数(例如,time(4) 只接受 int 值)。我的语法生成一个 AST,其中每个函数都有自己的节点类型(MagSqrtTime)。

我的第一个实现很简单:我支持的每个功能都有一个规则。

fn %= mag | sqrt | time;
mag %= (lit("mag") >> lit('(') > double_ > lit(')'));
sqrt %= (lit("sqrt") >> lit('(') > double_ > lit(')'));
time %= (lit("time") >> lit('(') > int_ > lit(')'));

这行得通,但如果输入包含不受支持的函数名称 (hello(12)),规则将失败且不会出现错误。我想要的是规则以 expectation_failure(或类似的)失败,即“Expected mag, sqrt or time, got 'hello'”。

下面是我尝试生成一个错误。它读取任何 ident 后跟一个左括号(使用期望运算符),然后使用 eps 中的谓词做两件事:根据函数名称生成正确的节点,如果名称失败未知,因此生成 expectation_failure。问题是 expectation_failure 的位置不是我想要的。它产生:

Expected <function parameters>
Got 12)

代替

Expected <mag, sqrt or time>
Got hello

有没有办法控制 expectation_failure::first::last 的值?或者除了我应该使用的 expectation_failure 之外,还有另一种报告错误的方法吗?另外,我不明白为什么我的 expectation_failure 在这种情况下指向“12)”而不仅仅是“12”。

#include <boost/spirit/include/qi.hpp>
#include <boost/spirit/include/phoenix_operator.hpp>
#include <boost/spirit/include/phoenix_function.hpp>
#include <iostream>
#include <string>

namespace qi = boost::spirit::qi;
namespace ascii = boost::spirit::ascii;
namespace spirit = boost::spirit;

struct Mag { double val; };
struct Sqrt { double val; };
struct Time { int val; };
using Fn = boost::variant<Mag, Sqrt, Time>;

std::ostream& operator<<(std::ostream& os, const Mag& v) {
os << "mag(" << v.val << ")";
return os;
}

std::ostream& operator<<(std::ostream& os, const Sqrt& v) {
os << "sqrt(" << v.val << ")";
return os;
}

std::ostream& operator<<(std::ostream& os, const Time& v) {
os << "time(" << v.val << ")";
return os;
}


BOOST_FUSION_ADAPT_STRUCT(Mag, (double, val))
BOOST_FUSION_ADAPT_STRUCT(Sqrt, (double, val))
BOOST_FUSION_ADAPT_STRUCT(Time, (int, val))


void makeMag_(Fn& fn, double val) {
Mag s;
s.val = val;
fn.swap(Fn(s));
}

void makeSqrt_(Fn& fn, double val) {
Sqrt s;
s.val = val;
fn.swap(Fn(s));
}

void makeTime_(Fn& fn, int val) {
Time s;
s.val = val;
fn.swap(Fn(s));
}

BOOST_PHOENIX_ADAPT_FUNCTION(void, makeMag, makeMag_, 2)
BOOST_PHOENIX_ADAPT_FUNCTION(void, makeSqrt, makeSqrt_, 2)
BOOST_PHOENIX_ADAPT_FUNCTION(void, makeTime, makeTime_, 2)

template <typename Iterator>
struct FnParser : qi::grammar<Iterator, qi::locals<std::string>, ascii::space_type, Fn()>
{
FnParser() : FnParser::base_type(fn)
{
using qi::double_;
using qi::int_;
using qi::_val;
using qi::_1;
using qi::_a;
using qi::_r1;
using qi::eps;
using qi::lit;
using qi::lexeme;
using qi::alpha;

ident %= lexeme[+alpha];

fnParams =
(eps(_r1 == "mag") >> double_) [makeMag(_val, _1)]
| (eps(_r1 == "sqrt") >> double_) [makeSqrt(_val, _1)]
| (eps(_r1 == "time") >> int_) [makeTime(_val, _1)]
;

fn = ident [_a = _1]
> lit('(')
> fnParams(_a) [_val = _1]
> lit(')');

ident.name("identifier");
fnParams.name("function parameters");
fn.name("function");
}

qi::rule<Iterator, qi::locals<std::string>, ascii::space_type, Fn()> fn;
qi::rule<Iterator, ascii::space_type, Fn(std::string)> fnParams;
qi::rule<Iterator, ascii::space_type, std::string()> ident;
};

int main() {

using Iter = std::string::const_iterator;
using boost::spirit::ascii::space;

FnParser <Iter> parser;

std::string str;

while (std::getline(std::cin, str)) {

if (str.empty() || str[0] == 'q' || str[0] == 'Q')
break;

Iter iter = str.begin();
Iter end = str.end();
Fn fn;

try {
bool r = phrase_parse(iter, end, parser, space, fn);

if (r && iter == end) {
std::cout << "Ok\n";
} else {
std::string rest(iter, end);
std::cout << "Failed\n"
<< "Stopped at \"" << rest << "\"\n";
}
} catch(qi::expectation_failure<Iter> e) {
std::string got(e.first, e.last);
std::cout << "Expected " << e.what_ << "\n"
<< "Got " << std::string(e.first, e.last) << "\n";
}
}
}

编辑

我没有给出完整的语法,因此可能缺少一些上下文。除了函数调用之外,完整的语法还有算术运算符和变量。区分函数调用和变量的唯一方法是后面是否存在左括号。两者都可以在相同的上下文中使用,我使用有序的替代 fn | var 优先调用函数。这就是为什么我将期望点放在括号之后,而不是之前。

最佳答案

您已经控制了预期失败的位置。

例如

mag %= (lit("mag") >> lit('(') > double_ > lit(')'));

期望点是> double_。要将其移动到参数列表的开头,请说:

mag %= lit("mag") > (lit('(') >> double_ > lit(')'));

顺便说一下,你可以这样写:

mag = "mag" > ('(' >> double_ >> ')'));

Also, I don't understand why my expectation_failure points to "12)" and not just "12" in this case.

我认为它只是打印到输入序列的末尾。对于输入迭代器 (qi::istream_iterator),它可能会打印到输入的最后一部分 seen,但这是猜测。

作为旁注,您可以使用此处记录的 on_error 获得更多控制:https://www.boost.org/doc/libs/1_67_0/libs/spirit/doc/html/spirit/qi/tutorials/mini_xml___error_handling.html以及编译器示例。


更新

编辑

The only way to tell apart a function call from a variable is the presence of an opening parenthesis afterwards. Both can be used in the same context and I use an ordered alternative fn | var to give priority to the function call. This is why I put the expectation point after the parenthesis, and not before.

你仍然可以拥有它:

mag = "mag" >> &lit('(') > ('(' >> double_ >> ')'));

这使用前瞻性 &lit('(') 进入一个分支,然后从期望点开始。所以,没有 '(' 只是一个非匹配,但期望点仍然在参数列表中“触发”。

使用 !lit('(') 进行否定先行断言。(文档 herehere)。

其他想法

你说:

The only way to tell apart a function call from a variable is the presence of an opening parenthesis afterwards

这当然取决于您对符号表和语义分析的选择。请参阅这些示例,其中我确实进行了动态功能检测:

稍微相关一些:

关于c++ - 在 boost::spirit 中正确设置 expectation_failure 的跨度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51364696/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com