gpt4 book ai didi

python - 用关键字或纯文本匹配多行

转载 作者:太空宇宙 更新时间:2023-11-04 04:03:10 27 4
gpt4 key购买 nike

import pyparsing as pp

pp.ParserElement.setDefaultWhitespaceChars(" \t")

# End of line. Clean it off.
NL = pp.LineEnd().suppress()

repeat_stmt = pp.Keyword("REPEAT") + pp.pyparsing_common.number()

end_stmt = pp.Keyword("END")

statement = (repeat_stmt | end_stmt)
text = pp.Group(~statement + pp.restOfLine)

structure = pp.ZeroOrMore(statement | text)
structure.ignore(NL)

DATA = """
line 1
line 2
a bit longer line 3
REPEAT 123
foo bar
END
"""

print(structure.parseString(DATA))

我正在尝试使用 pyparsing 构建相当简单的文本生成器。

鉴于上面的代码,我希望按原样复制非关键字行并解析关键字(目前所有两个)。

以上代码只会陷入无限循环

我希望输出是这样的:

[
['line 2'], ['line 2'], ['a bit longer line 3'],
[['REPEAT', 123]], ['foo bar'] [['END'],
]

我怎样才能做到这一点?

最佳答案

如果使用 setDebug 在 NL 解析上启用调试,

NL = pp.LineEnd().suppress().setDebug()

您会看到 NL 在输入字符串的末尾永远循环。您可以在 ZeroOrMore 使用 stopOn 时打破这个循环:

structure = pp.ZeroOrMore(statement | text, stopOn=pp.StringEnd())

通过此更改,您将获得:

[['line 1'], ['line 2'], ['a bit longer line 3'], 'REPEAT', 123, ['foo bar'], 'END', ['']]

关于python - 用关键字或纯文本匹配多行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57826476/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com