gpt4 book ai didi

c++ - boost::spirit 。将(名称)(描述)文本解析为 map

转载 作者:搜寻专家 更新时间:2023-10-31 01:53:28 25 4
gpt4 key购买 nike

我目前正在以下一种格式解析文本文件中的数据库模式:

(table_name) (table_description)

元素之间的分隔符为双回车(\n\n)我需要将其解析为 map ,使用 boost::spirit 进行解析。

问题是 table_description 也可以包含双重返回 (\n\n)。

table_name 有严格的格式,这是*qi::char_("a-z0-9_")table_description 可以包含任何字符,但以后总是从大写字母开始。

关于如何为这个解析器创建语法有什么想法吗?

最佳答案

这与 Spirit 文档中的文章非常相似:Parsing a List of Key-Value Pairs Using Spirit.Qi (2009 年 11 月 15 日)。

我能想到的最直接的语法依赖于括号:

    start         = pair % "\n\n";
parenthesized = '(' > *(char_ - ')') > ')';
pair = parenthesized >> "\n\n" >> parenthesized;

您当然可以 boost 它以要求您需要的表名和描述的确切语法(例如,以大写字母开头),但以上内容仅供说明。

唯一的/nifty/位是:

  • 使用 char_ - ')' _greedily 匹配括号内的任何内容(注意这还不支持嵌套的括号集)
  • 使用fusion adapter for std::pair直接解析成std::pair
  • 使用 qi::blank(不是 qi::space)跳过器来避免忽略换行符

这是一个完整的示例:

//#define BOOST_SPIRIT_DEBUG
#include <boost/fusion/adapted/std_pair.hpp>
#include <boost/spirit/include/qi.hpp>
#include <boost/spirit/include/karma.hpp>

namespace qi = boost::spirit::qi;
namespace karma = boost::spirit::karma;

typedef std::map<std::string, std::string> map_t;

template <typename It, typename Skipper = qi::space_type>
struct parser : qi::grammar<It, map_t(), Skipper>
{
parser() : parser::base_type(start)
{
using namespace qi;
// using phx::bind; using phx::ref; using phx::val;

start = pair % "\n\n";
pair = parenthesized >> "\n\n" >> parenthesized;
parenthesized = '(' > *(char_ - ')') > ')';

BOOST_SPIRIT_DEBUG_NODE(parenthesized);
BOOST_SPIRIT_DEBUG_NODE(pair);
BOOST_SPIRIT_DEBUG_NODE(start);
}

private:
qi::rule<It, std::string(), Skipper > parenthesized;
qi::rule<It, std::pair<std::string, std::string>(), Skipper> pair;
qi::rule<It, std::map <std::string, std::string>(), Skipper> start;
};

template <typename C, typename Skipper>
bool doParse(const C& input, const Skipper& skipper)
{
auto f(std::begin(input)), l(std::end(input));

parser<decltype(f), Skipper> p;
map_t data;

try
{
bool ok = qi::phrase_parse(f,l,p,skipper,data);
if (ok)
{
std::cout << "parse success\n";
std::cout << "data: " << karma::format(
(karma::auto_ << ": \"" << karma::auto_ << "\"") % karma::eol,
data) << "\n";
}
else std::cerr << "parse failed: '" << std::string(f,l) << "'\n";

if (f!=l) std::cerr << "trailing unparsed: '" << std::string(f,l) << "'\n";
return ok;
} catch(const qi::expectation_failure<decltype(f)>& e)
{
std::string frag(e.first, e.last);
std::cerr << e.what() << "'" << frag << "'\n";
}

return false;
}

template <typename C>
bool doParse(const C& input)
{
return doParse(input, qi::blank);
}

int main()
{
const std::string input = "(table_name)\n\n(table_description)\n\n(other_table)\n\n(other\n\ndescription)";
bool ok = doParse(input);

return ok? 0 : 255;
}

测试输出:

parse success
data: other_table: "other

description"
table_name: "table_description"

关于c++ - boost::spirit 。将(名称)(描述)文本解析为 map ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11106323/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com