gpt4 book ai didi

regex - html标签外匹配数据的问题

转载 作者:行者123 更新时间:2023-12-04 07:03:50 26 4
gpt4 key购买 nike

我试图想出一种方法来匹配 的内容不是 存在于任何 xml 或 html 标签中。我读过使用正则表达式从根本上对解析 xml/html 不利,我愿意接受任何可以解决我的问题的解决方案,但如果正则表达式也能正常工作就更好了。

这是我正在寻找的示例:

the lazy fox jumped <span>over</span> the brown fence.

我要回来的是
the lazy fox jumped  the brown fence

有任何想法吗?

最佳答案

这可能是一种幼稚的技术,但我的第一直觉是运行正则表达式,找出它在您的父字符串中匹配的文本,然后从该字符串中删除它,返回其余部分。在伪代码中,

String input = "whatever";
matches = Regex.Matches(input,"<.*>.*?</.*>");
foreach (match m in Matches)
{
input = input.Remove(m.Value);
}

关于regex - html标签外匹配数据的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1412840/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com