gpt4 book ai didi

python - 忽略正则表达式中文件中间的 xml 标记(带有非捕获组?)

转载 作者:太空宇宙 更新时间:2023-11-04 09:07:02 24 4
gpt4 key购买 nike

我有一个带有嵌入式标签的 xml,我想捕获除 FType 标签以外的所有内容...在 python 正则表达式中。

<xml>
<EType>
<E></E>
<F></F>
<FType><E1></E1><E2></E2></FType>
<FType><E1></E1><E2></E2></FType>
<FType><E1></E1><E2></E2></FType>
<G></G>
</EType>
</xml>

我试过了:

(?P<xml>.*(?=<FType>.*<FType>).*)

但它给了我一切;-(

我期望:

<xml>
<EType>
<E></E>
<F></F>
<G></G>
</EType>
</xml>

最佳答案

不需要正则表达式:

In [1]: x = '''    
<xml>
<EType>
<E></E>
<F></F>
<FType><E1></E1><E2></E2></FType>
<FType><E1></E1><E2></E2></FType>
<FType><E1></E1><E2></E2></FType>
<G></G>
</EType>
</xml>'''

In [2]: y = '\n'.join([tag for tag in x.split() if not tag.startswith('<FType>')])

In [3]: print y
<xml>
<EType>
<E></E>
<F></F>
<G></G>
</EType>
</xml>

关于python - 忽略正则表达式中文件中间的 xml 标记(带有非捕获组?),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19444413/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com