gpt4 book ai didi

c++ - 解析字符串(带空格)但忽略(Spirit)末尾的空格

转载 作者:行者123 更新时间:2023-11-30 04:29:52 41 4
gpt4 key购买 nike

我有一个要解析的输入字符串。它可能看起来像以下两者之一:

sys(error1, 2.3%)
sys(error2 , 2.4%)
sys(this error , 3%)

有时请注意逗号前的空格。在我的语法(boost spirit 库)中,我想分别捕获“error1”、“error2”和“this error”。

这是我必须捕获的原始语法 - 它吸收了名称末尾的空格:

name_string %= lexeme[+(char_ - ',' - '"')];
name_string.name("Systematic Error Name");

start = (lit("sys")|lit("usys")) > '('
> name_string[boost::phoenix::bind(&ErrorValue::SetName, _val, _1)] > ','
> errParser[boost::phoenix::bind(&ErrorValue::CopyErrorAndRelative, _val, _1)]
> ')';

我首先尝试解决此问题:

name_string %= lexeme[*(char_ - ',' - '"') > (char_ - ',' - '"' - ' ')];

然而那完全失败了。看起来它无法解析中间有空格的任何内容。

我对 Spirit 还很陌生 - 所以也许我遗漏了一些简单的东西。看起来 lexeme 关闭了前沿的跳过 - 我需要在前沿和后沿执行它的东西。

在此先感谢您的帮助!

感谢下面的 psur,我能够整理出一个答案。它并不完美(见下文),但我想我会更新帖子,让每个人都能在上下文中看到它并且格式很好:

qi::rule<Iterator, std::string(), ascii::space_type> name_word;
qi::rule<Iterator, std::string(), ascii::space_type> name_string;
ErrorValueParser<Iterator> errParser;

name_word %= +(qi::char_("_a-zA-Z0-9+"));
//name_string %= lexeme[name_word >> *(qi::hold[+(qi::char_(' ')) >> name_word])];

name_string %= lexeme[+(qi::char_("-_a-zA-Z0-9+")) >> *(qi::hold[+(qi::char_(' ')) >> +(qi::char_("-_a-zA-Z0-9+"))])];

start = (
lit("sys")[bind(&ErrorValue::MakeCorrelated, _val)]
|lit("usys")[bind(&ErrorValue::MakeUncorrelated, _val)]
)
>> '('
>> name_string[bind(&ErrorValue::SetName, _val, _1)] >> *qi::lit(' ')
>> ','
>> errParser[bind(&ErrorValue::CopyErrorAndRelative, _val, _1)]
>> ')';

这行得通!它们的关键是 name_string,其中的 qi::hold 是我之前不熟悉的运算符。它几乎就像一个子规则:qi::hold[...] 中的所有内容都必须成功解析才能运行。所以,上面,如果后面有另一个词,它只会在一个词​​后允许一个空格。结果是,如果一个单词序列以空格结尾,那么最后的空格将不会被解析!它们可以被后面的 *qi::lit(' ') 吸收(见开始规则)。

这里有两点我想弄清楚如何改进:

  • 最好将实际的字符串解析放入 name_word 中。问题在于 name_word 的声明 - 当它被放置在 name_string 定义中的适当位置时失败。

  • 如果 name_string 可以包含对尾随空格的解析,那就更好了,尽管它的返回值没有。我想我知道该怎么做......

当/如果我弄清楚了这些,我会更新这篇文章。感谢您的帮助!

最佳答案

以下规则应该适合您:

name_word %= +(qi::char_("_a-zA-Z0-9"));

start %= qi::lit("sys(")
>> qi::lexeme[ name_word >> *(qi::hold[ +(qi::char_(' ')) >> name_word ]) ]
>> *qi::lit(' ')
>> qi::lit(',')
// ...

name_word 只解析name中的一个单词;我假设它只包含字母、数字和下划线。

start 中,规则 qi::hold 很重要。只有当 next 是 name_word 时,它才会解析空格。在其他情况下,解析器将回滚并移动到 *qi::lit(' '),然后移动到逗号。

关于c++ - 解析字符串(带空格)但忽略(Spirit)末尾的空格,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9074572/

41 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com