gpt4 book ai didi

c# - 删除具有已知开始和结束字符串的字符串 c#

转载 作者:太空宇宙 更新时间:2023-11-03 21:46:55 25 4
gpt4 key购买 nike

我有一个 HTML 页面字符串,我想从 HTML 页面的开头删除一些字符串。我要删除的代码可以是

<!DOCTYPE HTML>

<!DOCTYPE anything in between>

无论如何,它总是以 <!DOCTYPE 开头并以 > 结尾.如何搜索此行并将其从 HTML 页面中删除?

到目前为止,我设法用 <!DOCTYPE HTML> 搜索并删除了第一个字符串使用以下代码

PageString = e.Result.Replace("<!DOCTYPE HTML>", "").Trim();

但是第二个呢?

最佳答案

您可以使用 Regex.Replace 来做到这一点方法:

PageString = Regex.Replace(e.Result, "<!DOCTYPE[^>]+>", string.Empty);

此处的模式将匹配任何以<!DOCTYPE 开头的子字符串后跟一个或多个不是 > 的字符, 其次是 > .这将替换任何看起来像 <!DOCTYPE anything in between> 的东西包括 <!DOCTYPE HTML> .

如果您使用起始 anchor (^) 仅在字符串的开头匹配此模式,您可能会更加安全并实际提高此方法的性能:

PageString = Regex.Replace(e.Result, "^<!DOCTYPE[^>]+>", string.Empty);

关于c# - 删除具有已知开始和结束字符串的字符串 c#,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16494306/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com