python - 为什么 Parsimonious 以 IncompleteParseError 拒绝我的输入？-6ren

python - 为什么 Parsimonious 以 IncompleteParseError 拒绝我的输入？

转载作者：太空狗更新时间：2023-10-29 17:20:19

我一直在尝试为我一直在设计的语言制定基本框架，并且我正在尝试使用Parsimonious为我做解析。截至目前，我已经声明了以下语法:

grammar = Grammar(
    """
    program = expr*
    expr    = _ "{" lvalue (rvalue / expr)* "}" _
    lvalue  = _ ~"[a-z0-9\\-]+" _
    rvalue  = _ ~".+" _
    _       = ~"[\\n\\s]*"
    """
)

当我尝试输出像 "{ do-something some-argument }" 这样的简单输入字符串的结果 AST 时:

print(grammar.parse("{ do-something some-argument }"))

Parsimonious 决定断然拒绝它，然后给我这个有点神秘的错误:

Traceback (most recent call last):
  File "tests.py", line 13, in <module>
    print(grammar.parse("{ do-something some-argument }"))
  File "/usr/local/lib/python2.7/dist-packages/parsimonious/grammar.py", line 112, in parse
    return self.default_rule.parse(text, pos=pos)
  File "/usr/local/lib/python2.7/dist-packages/parsimonious/expressions.py", line 109, in parse
    raise IncompleteParseError(text, node.end, self)
parsimonious.exceptions.IncompleteParseError: Rule 'program' matched in its entirety, but it didn't consume all the text. The non-matching portion of the text begins with '{ do-something some-' (line 1, column 1).

起初我认为这可能是与我的空白规则相关的问题，_，但在尝试删除某些地方的空白规则失败后，我仍然想出同样的办法错误。

我试过在线搜索，但我发现的似乎是远程相关的是 this question ，这对我没有任何帮助。

我的语法有问题吗？我没有以正确的方式解析输入吗？如果有人对此有可能的解决方案，将不胜感激。

最佳答案

我远不是 Parsimonious 方面的专家，但我相信问题是 ~".+" 贪婪地匹配输入字符串的全部剩余部分，没有留下任何东西来匹配其余部分生产。我最初通过将 rvalue 的正则表达式更改为 ~"[a-z0-9\\-]+" 来测试这个想法，与你为 左值。现在它解析并(令人惊奇地)通过上下文区分两个相同定义的标记 lvalue 和 rvalue。

from parsimonious.grammar import Grammar

grammar = Grammar(
    """
    program = expr*
    expr    = _ "{" lvalue (rvalue / expr)* "}" _
    lvalue  = _ ~"[a-z0-9\\-]+" _
    rvalue  = _ ~"[a-z0-9\\-]+" _
    _       = ~"[\\n\\s]*"
    """
)

print(grammar.parse( "{ do-something some-argument }"))

如果你想让 rvalue 匹配任何非空白字符序列，你需要更像这样的东西:

rvalue = _ ~"[^\\s\\n]+" _

但是哎呀!

{ foo bar }

"}" 是一个右花括号，但它也是一个或多个非空白字符的序列。是 "}" 还是 rvalue？语法说下一个标记可以是其中之一。其中一种解释是可解析的，而另一种则不是，但 Parsimonious 只是说它是菠菜，见鬼去吧。我不知道解析专家是否会认为这是解决歧义的合法方法(例如，这样的语法可能会导致有两种可能的解释的情况都解析)，或者这有多实用去实现。无论如何，Parsimonious 不会做出这样的决定。

所以我们需要在大括号问题上排斥寄宿生。我认为这个语法可以满足您的需求:

from parsimonious.grammar import Grammar

grammar = Grammar(
    """
    program = expr*
    expr    = _ "{" lvalue (expr / rvalue)* "}" _
    lvalue  = _ ~"[a-z0-9\\-]+" _
    rvalue  = _ ~"[^{}\\n\\s]+" _
    _       = ~"[\\n\\s]*"
    """
)

print(grammar.match( "{ do-something some-argument 23423 {foo bar} &^%$ }"))

我也排除了左大括号，因为您希望这个字符串如何标记化？

{foo bar{baz poo}}

我希望

"{" "foo" "bar" "{" "baz" "poo" "}" "}"

...因为如果 "poo}" 被期望标记为 "poo" "}" 和 "{foo" 应该标记为 "{" "foo"，然后将 bar{baz 视为 "bar{baz" 或 "bar{" "baz" ~~deranged~~ 违反直觉。

现在我记得我对 yacc 的强烈仇恨是如何驱使我对它着迷的。

关于python - 为什么 Parsimonious 以 IncompleteParseError 拒绝我的输入？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33417960/

文章推荐： python - 无法在命令提示符下两次捕获KeyboardInterrupt？

文章推荐： angular - 是否可以在 Angular 2+ 中进行条件内容投影(包含)

文章推荐：自定义 malloc() 实现头设计

文章推荐： angular - 捕获从中的组件发出的事件？

python - 使用 parsimonious 解析势函数的参数
问题最初在 code review 上提出。通过推荐再次在这里询问。背景一个forcefield是用于计算复杂系统势能的函数和参数的集合。我有文本文件，其中包含有关力场参数的数据。文本文件分为许
python - 使用 Parsimonious Python 库解析多行文本
我正在尝试使用 python parsimonious 库解析多行文本。我已经玩了一段时间了，不知道如何有效地处理换行符。一个例子如下。下面的行为是有道理的。我看到了this comment来自 Er
algorithm - 了解 Small Parsimony，Sankoff 算法
小简约问题:在进化树中找到内部顶点的最简约标签。输入:树 T，每片叶子都标有 m 个字符串。输出:最小化简约分数的树 T 内部顶点的标记。我指的是这篇文章底部的图片。我只是想按照提供的示例进行操作。
python - 为什么 Parsimonious 以 IncompleteParseError 拒绝我的输入？
我一直在尝试为我一直在设计的语言制定基本框架，并且我正在尝试使用Parsimonious为我做解析。截至目前，我已经声明了以下语法: grammar = Grammar( """ pr

太空狗

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 为什么 Parsimonious 以 IncompleteParseError 拒绝我的输入？