gpt4 book ai didi

html-agility-pack - HtmlAgilityPack 和 HtmlDecode

转载 作者:行者123 更新时间:2023-12-03 06:01:38 24 4
gpt4 key购买 nike

我目前正在使用 HtmlAgilityPack 和控制台应用程序来抓取网站。由于 html 已编码(它返回编码字符,例如 '),因此我必须在将内容保存到数据库之前进行解码。

有没有办法使用 HtmlAgilityPack 解码返回的 html,而不必使用 HttpUtility.HtmlDecode?如果可能的话,我想避免将 System.Web 添加到我的控制台应用程序中。

最佳答案

Html Agility Pack 配备了一个名为HtmlEntity 的实用程序类。它有一个具有以下签名的静态方法:

/// <summary>
/// Replace known entities by characters.
/// </summary>
/// <param name="text">The source text.</param>
/// <returns>The result text.</returns>
public static string DeEntitize(string text)

它还支持众所周知的实体(例如  )和编码字符,例如 '

关于html-agility-pack - HtmlAgilityPack 和 HtmlDecode,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6665488/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com