gpt4 book ai didi

html - 使用 sed 提取 HTML 标签数据

转载 作者:搜寻专家 更新时间:2023-10-31 23:14:07 25 4
gpt4 key购买 nike

我想在已知的 HTML 标签之间提取数据。例如:

Hello, <i>I<i> am <i>very</i> glad to meet you.

应该变成:

'I

very'

所以我找到了一些几乎可以做到这一点的东西。不幸的是,它只提取最后一个条目。

sed -n -e 's/.*<i>\(.*\)<\/i>.*/\1/p'

现在我可以附加任何结束标记 </i>使用换行符,效果很好。但是有没有办法只用一个 sed 命令就可以做到这一点?

最佳答案

试一试:

sed -n 's|[^<]*<i>\([^<]*\)</i>[^<]*|\1\n|gp'

并且您的示例缺少“/”:

Hello, <i>I</i> am <i>very</i> glad to meet you.

关于html - 使用 sed 提取 HTML 标签数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3588782/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com