gpt4 book ai didi

linux - 仅使用正则表达式查找一行中的第一个匹配项

转载 作者:太空宇宙 更新时间:2023-11-04 12:18:40 24 4
gpt4 key购买 nike

我有一些 xml 文件,我想在用 Python 将它们解析为 csv 文件之前进行一些预处理(内存问题)。

假设我想从类似

的 xml 文件中 grep 标题包含“abcd”的内容
<Title> Project abcd </Title> <Id> xxxx</Id> <Group>xxxx</Group>... <Title> Project abcd </Title>

因为重复的标题字段,如果我这样做

grep -Ei "<Title>.*abcd.* </Title>"

如果“abcd”巧合地包含在 Id 或其他不相关的字段中,它将返回该行。

有没有一种方法可以使用 grep 返回只有标题字段包含我想要查找的模式的行?

最佳答案

您应该知道使用正则表达式解析 html/xml 的风险。如果你必须这样做,尝试

'<Title>[^<]*abcd[^<]*</Title>'

关于linux - 仅使用正则表达式查找一行中的第一个匹配项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46650181/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com