gpt4 book ai didi

c# - 使用正则表达式删除属性。只是属性值包含特殊字符 "<"

转载 作者:行者123 更新时间:2023-11-30 20:23:43 24 4
gpt4 key购买 nike

我想删除 html 中的标题属性。但只要标题值具有“<”字符。

要清理的文本: <a href="" title="bla bla bla" /><a href="" title=" bla bl<a bla" />
输出文本: <a href="" title="bla bla bla" /><a href="" />

如您所见,第二个标题已从文本中删除,因为标题值包含 < 字符。

请帮忙

最佳答案

帮自己一个忙,在使用 HTML 时使用 HTML 解析器;例如 Html Agility Pack .

然后像这样的任务变得很简单:

var html = "<a href=\"\" title=\"bla bla bla\" /><a href=\"\" title=\" bla bl<a bla\" />";

var doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(html);

// select all nodes with title attribute
foreach (var element in doc.DocumentNode.SelectNodes("//@title"))
// and remove it
if (element.Attributes["title"].Value.Contains("<"))
element.Attributes["title"].Remove();

关于c# - 使用正则表达式删除属性。只是属性值包含特殊字符 "<",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28340446/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com