gpt4 book ai didi

c# - 使用 Regex C# 从 HTML 标签中删除样式

转载 作者:行者123 更新时间:2023-12-03 20:21:45 25 4
gpt4 key购买 nike

我想使用 C# 从 HTML 标签中删除样式。它应该只返回 HTML 简单标签。
对于即
如果 String = <p style="margin: 15px 0px; padding: 0px; border: 0px; outline: 0px;">Hello</p>那么它应该返回 String = <p>Hello</p>
就像所有 HTML 标签一样,<strong></string>, <b></b>等等等等
请帮我解决这个问题。

最佳答案

首先,正如其他人所建议的,使用合适的 HTML 解析器的方法是 much better .要么使用 HtmlAgilityPackCsQuery .

如果你真的想要一个正则表达式解决方案,这里是:

替换此模式:(<.+?)\s+style\s*=\s*(["']).*?\2(.*?>)与:$1$3
演示:http://regex101.com/r/qJ1vM1/1

要删除多个属性,因为您使用的是 .NET,这应该可以工作:

替换 (?<=<[^<>]+)\s+(?:style|class)\s*=\s*(["']).*?\1带有空字符串

关于c# - 使用 Regex C# 从 HTML 标签中删除样式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25306663/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com