- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用 pyparsing
来解析包含“节标题”和“项目”的列表。在本例中,节是天数,而项目是我们需要的杂货买。
from pyparsing import *
input = """Monday
- eggs
- milk
Tuesday
- bread
- flour
"""
day = Word(alphas)("day")
item = Suppress("- ") + rest_of_line
items = OneOrMore(item)("items")
daily_shopping_list = OneOrMore(day + items)
print(daily_shopping_list.parse_string(input).asDict())
返回 {'day': 'Tuesday', 'items': ['bread', 'flour']}
所需的输出是 {{'day': 'Monday', 'items': ['eggs', 'milk']}, {'day': 'Tuesday', 'items': ['面包', '面粉']}}
为什么这段代码跳过星期一?
谢谢。
编辑:正如 Tim Roberts 提到的,删除 .asDict()
会产生一个有效的输出:
['星期一', ['鸡蛋', '牛奶'], '星期二', ['面包', '面粉']]
最佳答案
这是 pyparsing 的第一个很棒的项目。 pyparsing 提供的一些功能有助于返回这样的结构化数据。
首先,当您调用 parse_string()
时,它返回一个 pyparsing ParseResults
https://pyparsing-docs.readthedocs.io/en/latest/pyparsing.html#pyparsing.ParseResults目的。如果你打印出来,你会得到:
result = daily_shopping_list.parse_string(input)
print(result)
['Monday', 'eggs', 'milk', 'Tuesday', 'bread', 'flour']
它看起来像一个字符串列表,但有更多的特性。
首先要看的是调用dump()
方法。这将列出已解析的字符串,然后是缩进的命名项列表。
print(result.dump())
['Monday', 'eggs', 'milk', 'Tuesday', 'bread', 'flour']
- day: 'Tuesday'
- items: ['bread', 'flour']
正如蒂姆·罗伯茨 (Tim Roberts) 指出的那样,命名的默认设置类似于 Python 字典:最后存储的值就是您最终得到的值。
您实际上非常接近获得您想要的结构化结果。添加一个 pyparsing Group
表达式,更改此行:
daily_shopping_list = OneOrMore(day + items)
到这一行:
daily_shopping_list = OneOrMore(Group(day + items))
这将创建日项目组,在此更改之后,results.dump()
打印:
[['Monday', 'eggs', 'milk'], ['Tuesday', 'bread', 'flour']]
[0]:
['Monday', 'eggs', 'milk']
- day: 'Monday'
- items: ['eggs', 'milk']
[1]:
['Tuesday', 'bread', 'flour']
- day: 'Tuesday'
- items: ['bread', 'flour']
这实际上是一个包含 2 个 ParseResults
的 ParseResults
,每个解析的 Group
一个。 dump()
显示可用于访问命名值的名称。例如,您可以获得第一天的值:
results[0]["day"]
results[0]["items"]
就像他们是听写的一样。您还可以将它们视为对象中的属性(如果名称是有效的 Python 标识符):
results[0].day
results[0].items
如果您希望它们作为字典,则在每个包含的 ParseResults
上调用 as_dict()
:
print([day_list.as_dict() for day_list in result])
[{'day': 'Monday', 'items': ['eggs', 'milk']}, {'day': 'Tuesday', 'items': ['bread', 'flour']}]
如果你想把它作为一个嵌套的字典,其中每一天的名字都是子字典的字典键,你可以让 pyparsing 使用每个组中的第一个元素作为键,方法是包装 OneOrMore
pyparsing Dict
中的表达式:
daily_shopping_list = Dict(OneOrMore(Group(day + items)))
现在 results.dump()
的第一部分显示了这些键:
[['Monday', 'eggs', 'milk'], ['Tuesday', 'bread', 'flour']]
- Monday: ['eggs', 'milk']
- day: 'Monday'
- items: ['eggs', 'milk']
- Tuesday: ['bread', 'flour']
- day: 'Tuesday'
- items: ['bread', 'flour']
您可以使用日期名称作为键:
result["Monday"]["items"]
现在调用 result.as_dict()
将 pprint
为:
from pprint import pprint
pprint(result.as_dict())
{'Monday': {'day': 'Monday', 'items': ['eggs', 'milk']},
'Tuesday': {'day': 'Tuesday', 'items': ['bread', 'flour']}}
关于python - 如何使用 pyparsing 解析此列表?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/73752507/
PEG论文描述了两种语义谓词解析表达式: 和谓词&e 不是谓词!e pyparsing 是否支持 And 谓词?或者这只是排序解析表达式的同义词?在这种情况下,它应该等同于 And 类。对吗? Not
我有以下语法和测试用例: from pyparsing import Word, nums, Forward, Suppress, OneOrMore, Group #A grammar for a
我想用这些条件解析带有嵌套括号的字符串: 元素由逗号分隔 ,或吧 | . 嵌套括号元素可能是单个字母数字或另一个嵌套括号。 每个嵌套括号元素由条 | 连接字面量导致创建一个新序列,该序列将先前的序列元
有以下我要解析的字符串: ((K00134,K00150) K00927,K11389) (K00234,K00235) 每个步骤由空格分隔,交替由逗号表示。我被困在字符串的第一部分,括号内有一个空格
所以这是取自 fourFn.py 的解析器: from pyparsing import ( Literal, Word, Group, Forward, al
所以我在制作解析器时,发现了一个问题。事实上,为了解析数字,我有: from pyparsing import Word, nums n = Word(nums) 这适用于没有千位分隔符的数字。例如,
我有一个简单的数据集,可以使用如下行进行解析: R1 (a/30) to R2 (b/30), metric 30 我需要从上面得到的唯一数据如下: R1, a, 30, R2, 192.168.0.
我正在尝试使用 pyparsing 来构建一个解析器,该解析器将匹配任意嵌套的一组括号内的所有文本。如果我们考虑这样的字符串: "[A,[B,C],[D,E,F],G] Random Middle t
from pyparsing import * class AParseActionHolder(object): def __call__(self, string, index, t):
我正在寻找一种改进使用pyparsing构建的解析器性能的方法。我阅读了关于packrat的解析,看来这确实可以帮助解析器提高性能。但是,当我启用packrat解析时,性能会变差!如果没有packra
我正在尝试使用一些特殊规则(例如相邻值和邻近值)创建 bool 查询解析器。到目前为止我创建的规则是 ## DEFINITIONS OF SYMBOLS ### NEAR = CaselessLite
我编写此脚本是为了使用类似于序言的语法来解析语句,将连接词视为具有优先级的运算符: import pyparsing as pyp alphabet = "abcdefghijklmnopqrstuv
我有一个来自游戏的文件,我正在尝试解析它。以下是摘录: id: 50 #Survival Stage bound: 1500 # phase 0 bandi
我很难理解允许在参数名称中使用“\”的语法(例如 net\)。然而,“\”也可用作续行(参见例 2)。 Ex1 工作正常,但 linebreak 和 identifier 变量之间存在冲突。 Ex1:
我正在尝试学习 pyparsing。这听起来很有希望,并且用于文本处理会很有趣。无论如何,这是我的问题: 我有一个类(class)名称列表。例如, courselist = ["Project Bas
我想利用 cStyleComment 变量,但我想专门处理它们,而不是仅仅忽略这些注释。有什么方法可以让 pyparsing 在将其识别为注释的输入片段上调用我的处理程序,然后再将其丢弃吗? 我正在处
我今天早些时候发布了一个关于同一问题的问题,但由于该问题的解决方案是切换库,而我现在对另一个库有问题,我想我会提出另一个问题......希望没关系。 所以我不想匹配以下标记: ... 我不
我有一个如下所示的数据: data = 'person(firstame="bob", lastname="stewart", dob="2010-0206", hobbies=["reading,
我正在通过解析文件 output=wilcard.parseFile(myfile) print output 我确实只得到了字符串的第一个匹配。 我有一个大的配置文件需要解析,其中的“条目”用大括号
我需要解析以下三行: Uptime is 1w2d Last reset at 23:05:56 Reason: reload 但最后两行并不总是存在,在第一次重新启动之前输出可能如下所示: Up
我是一名优秀的程序员,十分优秀!