gpt4 book ai didi

c# - HtmlAgilityPack 来替换子项,为什么它不起作用?

转载 作者:行者123 更新时间:2023-11-30 17:50:06 25 4
gpt4 key购买 nike

我实现了一个请求“http://cnblogs.com”页面的功能。
当我使用HtmlAgilityPack替换更多的HtmlNode时,出现了一些困惑的东西-----无法替换。

代码是:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Net;
using System.Text;
using System.Threading.Tasks;
using HtmlAgilityPack;//I Use NuGet to include HtmlAgilityPack(Vs2012)

namespace CatchWebSample
{
class Program
{
public static void Main(string[] args)
{
HtmlDocument document = new HtmlDocument();
WebClient wc = new WebClient();
wc.Encoding = Encoding.GetEncoding("utf-8");
string content = wc.DownloadString("http://cnblogs.com");
document.LoadHtml(content);
string oldContent = document.DocumentNode.OuterHtml;

//here, I want to replace all xpath= //div[@class='post_item_foot'] htmlnodes
HtmlNodeCollection targetNodeCollection = document.DocumentNode.SelectNodes(@"//div[@class='post_item_foot']");

HtmlNode newHtmlNode;
if (targetNodeCollection != null && targetNodeCollection.Count > 0)
{
for (int i = 0; i < targetNodeCollection.Count; i++)
{
var targetNode = targetNodeCollection[i];
newHtmlNode = document.CreateElement("span");
newHtmlNode.InnerHtml = HtmlDocument.HtmlEncode("###### REPLACED CONTENT #########");

targetNode.ParentNode.ReplaceChild(newHtmlNode, targetNode);
}

content = document.DocumentNode.OuterHtml;

//but the result is same of the original data,why it can not replace ?
bool flag = string.Compare(oldContent, content) == 0;
}

}
}
}

我很困惑,为什么?

最佳答案

replaceChild() 和 insertAfter() 突然间它们都停止为我工作了。

我最好的选择是用“新的 html 字符串”替换 innerhtml

targetnode.innerhtml = newNodeAsString;

编辑:

HtmlAgilityPack 在插入值/节点时存在错误。由于一些缓存使其工作得更快。

这就是我放弃它的原因。并使用了 AngleSharp

编辑:

2017 年中期 HAP 正在开发中 here .我不会回去。你也不能在 HAP 制造问题。

关于c# - HtmlAgilityPack 来替换子项,为什么它不起作用?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21013576/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com