gpt4 book ai didi

c# - 删除除一个标签外的所有 html 标签

转载 作者:太空狗 更新时间:2023-10-30 00:53:37 28 4
gpt4 key购买 nike

我有一些代码可以删除所有 html 标签,但我想删除所有 html,但 </td> 除外。和 </tr>标签。

如何做到这一点?

public string HtmlStrip( string input)
{
input = Regex.Replace(input, "<input>(.|\n)*?</input>", "*");
input = Regex.Replace(input, @"<xml>(.|\n)*?</xml>", "*"); // remove all <xml></xml> tags and anything inbetween.
return Regex.Replace(input, @"<(.|\n)*?>", "*"); // remove any tags but not there content "<p>bob<span> johnson</span></p>" becomes "bob johnson"
}

最佳答案

Regex 不适合解析 XML 或 HTML。查看 HTML Agility Pack

HTML Agility Pack

关于c# - 删除除一个标签外的所有 html 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15557591/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com