gpt4 book ai didi

c# - 使用 LINQ 或 C# 从字符串中清理特定 HTML 的算法

转载 作者:行者123 更新时间:2023-11-27 22:44:55 25 4
gpt4 key购买 nike

背景信息:我有大量文本,我经常将它们封装在 XML 文档中的单个字符串中(使用 LINQ)。此字符串包含许多我需要保留以用于输出目的的 HTML,但需要删除此字符串中偶尔出现的电子邮件和离散 HTML 链接。违规文本的示例如下所示:

--<a href="mailto:jsmith@email.com" target="_blank">John Smith</a> from <a href="http://www.agenericwebsite.com" target="_blank">Romanesque Architecture</a></p>

我需要能够做的是:

  1. 找到以下字符串:<a href
  2. 删除该字符串和它后面一直到字符串 > 的所有字符
  3. 此外,始终删除此字符串 </a>

有没有一种方法可以使用 LINQ 轻松完成此操作,或者我是否必须使用 .NET 字符串操作创建算法来实现此目的?

最佳答案

您或许可以使用 LINQ 执行此操作,但听起来常规的旧 REGEX 会好得多。

听起来像this question ,特别是 this answer展示你正在尝试做什么。

关于c# - 使用 LINQ 或 C# 从字符串中清理特定 HTML 的算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8125668/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com