- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用 PyParsing 为相当复杂的语法实现一个解析器。 (如果我可以补充的话,使用起来真的很愉快!)
语法有点“动态”,因为它允许定义(各种)字母表,这些字母表又定义了其他定义中允许的元素。例如:
alphabet: a b c
lists:
s1 = a b
s2 = b c x
此处,alphabet
用于定义lists
定义中允许的元素。例如,s1
是有效的,但 s2
包含无效的 x
。
没有这种验证的简单 PyParsing 解析器可能如下所示:
from pyparsing import Literal, lineEnd, Word, alphanums,\
OneOrMore, Group, Suppress, dictOf
def fixedToken(literal):
return Suppress(Literal(literal))
Element = Word(alphanums)
Alphabet = Group(OneOrMore(~lineEnd + Element))
AlphaDef = fixedToken("alphabet:") + Alphabet
ListLine = OneOrMore(~lineEnd + Element)
Lists = dictOf(Word(alphanums) + fixedToken("="), ListLine)
Start = AlphaDef + fixedToken("lists:") + Lists
if __name__ == "__main__":
data = """
alphabet: a b c
lists:
s1 = a b
s2 = b c x
"""
res = Start.parseString(data)
for k, v in sorted(res.items()):
print k, "=", v
这将解析并给出输出:
Alphabet= set(['a', 'c', 'b'])
s1 = ['a', 'b']
s2 = ['b', 'c', 'x']
但是,我希望解析器为 s2
引发 ParseException(或类似异常),因为它包含无效的 x
。理想情况下,我希望能够使 ListLine
的定义类似于:OneOrMore(oneOf(Alphabet))
- 但显然,这需要一些动态解释这只能在 Alphabet
实际被解析和组装后完成。
我找到的一个解决方案是将解析操作添加到 1. 记住字母表和 2. 验证行:
# ...
Alphabet = Group(OneOrMore(~lineEnd + Element))
def alphaHold(toks):
alphaHold.alpha = set(*toks)
print "Alphabet=", alphaHold.alpha
Alphabet.addParseAction(alphaHold)
AlphaDef = fixedToken("alphabet:") + Alphabet
ListLine = OneOrMore(~lineEnd + Element)
def lineValidate(toks):
unknown = set(toks).difference(alphaHold.alpha)
if len(unknown):
msg= "Unknown element(s): {}".format(unknown)
print msg
raise ParseException(msg)
ListLine.addParseAction(lineValidate)
# ...
这几乎给出了所需的输出:
Alphabet= set(['a', 'c', 'b'])
Unknown element(s): set(['x'])
s1 = ['a', 'b']
但不幸的是,PyParsing 捕获了解析操作抛出的异常,因此这种方法在技术上失败了。在 PyParsing 中是否有另一种我可能错过的方法来实现这一点?
最佳答案
您已经非常接近这个工作了。在许多情况下,pyparsing 解析器会根据先前解析的文本动态调整自身。诀窍是使用 Forward
占位符表达式,然后将所需的值作为解析操作的一部分插入到占位符中(非常接近您现在的位置) .像这样:
Element = Forward()
Alphabet = OneOrMore(~lineEnd + oneOf(list(alphas)))
def alphaHold(toks):
Element << oneOf(toks.asList())
Alphabet.setParseAction(alphaHold)
从这里开始,我认为您的其余代码按原样运行得相当好。实际上,您甚至不需要行验证函数,因为 pyparsing 只会将有效的元素名称匹配为使用此方法的元素。
您可能会发现 pyparsing 的错误报告有点模糊。在某些明智的地方使用“-”而不是“+”可以让事情变得更好一些。由于 pyparsing 将 ParseExceptions 用于表达式匹配/不匹配的所有内部信号,因此它不会自动识别您何时进入已定义的表达式,但随后对包含的表达式进行无效匹配。您可以使用“-”运算符告诉 pyparsing 检测此问题,如下所示:
ListDef = listName + '=' - OneOrMore(~lineEnd + Element)
一旦 pyparsing 获得名称和“=”符号,则发现任何无效元素将立即引发 ParseSyntaxException
,这将停止 pyparsing 在该点对文本的扫描,并报告异常无效元素的位置。
关于python - 如何验证 PyParsing 中动态定义的语法元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17946734/
在complier.h中有一个宏定义如下: # define __cond_lock(x,c) ((c) ? ({ __acquire(x); 1; }) : 0) 但是这里我有一个问题,就是哪里
curl_easy_setopt 的选项在哪里?定义?我试图寻找 CURLOPT_VERBOSE 和其他一些整数值,但这些似乎没有在 curl.h 中明确定义。 最佳答案 第 792 行: #ifde
我确实有一个如下所示的类(class): //.h file class __declspec(dllimport) MyClass { public: //stuff pri
作者: zhuwenzhuang, 2024.05.08. 阅读前假设读者熟悉数据库使用,了解 SQL 的语法和关系算子的大概含义, 能通过 EXPLAIN 命令查看数据库执行计划. 0 前言
我似乎无法找到是否可以声明一个 header 对象以便在响应 header 中重用它,有一些示例定义了响应模式的对象,但它不会转置为响应 header 。我只设法制作了一个可重用的响应对象,如下所示:
css 选择器 * + * 实际上是什么意思?当您执行检查元素时,您可以在谷歌浏览器的控制台中看到它。在我看来,这似乎是对 "Every second child"应用一种风格,但仍然想确定。谁能帮我
我试图弄清楚基本的IO Haskell 函数是定义好的,所以我使用了this reference我到了putChar函数定义: putChar :: Char -> IO () putChar
我得到了一个自动生成的文件,该文件定义了程序集属性,我正在尝试理解内容。 [assembly: global::System.Runtime.Versioning.TargetFrameworkAtt
This文档演示了如何检查变量是否先前已在 gnuplot 脚本中定义。 文档中的示例: a = 10 if (exists("a")) print "a is defined" if (!exist
好吧,这是一个相当基本的问题:我正在关注 SICP 视频,我对 define、let 和 之间的区别有点困惑设置!. 1) 根据 Sussman 在视频中的说法,define 只允许为变量附加一个值一
我一直在尝试定义一个包含只能具有以下三个值之一的字段的 XSD: 绿色 红色 蓝色 本质上,我想在架构级别定义严格的枚举。 我的第一次尝试似乎是错误的,我不确定修复它的“正确”方法。
有人可以定义“POCO”到底是什么意思吗?我越来越频繁地遇到这个术语,我想知道它是否仅与普通类有关还是意味着更多? 最佳答案 “普通旧式 C# 对象” 只是一个普通的类,没有描述基础结构问题或域对象不
在我经常看到的一些django模型中 myfield = models.CharField(_('myfield')) class_name = models.CharField(_('Type'),
每当 BOOL 数据类型不容易预定义时,我都会使用以下定义进行 boolean 运算, typedef unsigned char BOOL; (由于内存使用)。 我意识到出于性能原因,使用本地总线宽
l_ABC_BEANVector = utilRemote.fnGetVector("ABC_COVBEANVector"); 编码的含义是什么?任何帮助,我真的很感激。谢谢 最佳答案 唯一可以肯定地
我正在使用 javacc 开发一个项目,我遇到问题并需要一些帮助,我的文件中有这样的内容: STRING COPYRIGHT (C) 2003, 2004 SYNOPSYS, INC.; 我为单词 S
我想弄清楚基本的 IO定义了 Haskell 函数,所以我使用了 this reference然后我到了 putChar函数定义: putChar :: Char -> IO () putCha
我在具体类中使用 @property 定义 getter 时遇到问题。这是Python代码: from abc import ABCMeta, abstractproperty class abstr
我正在为大学用 C 语言编写一个小游戏,但我陷入了困境。我(在头文件中)有这个结构: typedef struct{ game_element field[MAX_ROWS][MAX_COLU
我一直在 .l 文件中创建标记定义。由于数据集数量庞大,它变得有点乏味。有没有办法读取文件中的所有单词,例如包含所有名词的 noun.txt 并给所有名词一个标记。 基本上,我想自动化这部分: %%
我是一名优秀的程序员,十分优秀!