gpt4 book ai didi

python - 如何解析grep生成的文件中的数据?

转载 作者:行者123 更新时间:2023-12-01 02:07:46 25 4
gpt4 key购买 nike

我使用“grep”从一个巨大的 XML 文件中获取一些数据。文件的一部分如下所示:

    <title>Hlavní strana</title>
<ns>0</ns>
--
<title>Nápověda:Jak vytvořit článek</title>
<ns>12</ns>
--
<title>Nápověda:Editace stránky podrobně</title>
<ns>12</ns>
--
<title>Astronomie</title>
<ns>0</ns>
--
<title>Biologie</title>
<ns>0</ns>

现在我需要提取“title”括号之间“ns”属性为 0 的所有内容。我尝试使用正则表达式,但它不起作用。我真的不知道如何解析这样的文件以获得我想要的内容。非常感谢任何建议!

最佳答案

最好使用 XML parser 在原始 xml 上获取您所需的信息。但要回答您的问题,下面的代码片段可能会有所帮助。

演示

s = """    <title>Hlavní strana</title>
<ns>0</ns>
--
<title>Nápověda:Jak vytvořit článek</title>
<ns>12</ns>
--
<title>Nápověda:Editace stránky podrobně</title>
<ns>12</ns>
--
<title>Astronomie</title>
<ns>0</ns>
--
<title>Biologie</title>
<ns>0</ns>"""


import re
pattern = r"<title>(.*?)</title>\s+<ns>0</ns>"
print re.findall(pattern, s)

输出:

['Hlavn\xc3\xad strana', 'Astronomie', 'Biologie']

关于python - 如何解析grep生成的文件中的数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48904567/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com