gpt4 book ai didi

html-agility-pack - 如何在不丢失 DOCTYPE 的情况下使用 Agility Pack 从 HTML 中删除注释

转载 作者:行者123 更新时间:2023-12-04 02:50:54 28 4
gpt4 key购买 nike

我正在尝试从 HTML 中删除不必要的内容。具体来说,我想删除评论。我找到了一个很好的解决方案( Grabbing meta-tags and comments using HTML Agility Pack )但是 DOCTYPE 被视为注释,因此与注释一起删除。如何改进下面的代码以确保保留 DOCTYPE?

var htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(htmlContent);
var nodes = htmlDoc.DocumentNode.SelectNodes("//comment()");
if (nodes != null)
{
foreach (HtmlNode comment in nodes)
{
comment.ParentNode.RemoveChild(comment);
}
}

最佳答案

检查评论是否不以 DOCTYPE 开头

  foreach (var comment in nodes)
{
if (!comment.InnerText.StartsWith("DOCTYPE"))
comment.ParentNode.RemoveChild(comment);
}

关于html-agility-pack - 如何在不丢失 DOCTYPE 的情况下使用 Agility Pack 从 HTML 中删除注释,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6567484/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com