c# - 字符串到 HtmlDocument-6ren

c# - 字符串到 HtmlDocument

转载作者：IT王子更新时间：2023-10-29 04:13:25

26

4

我正在使用 WebClient.DownloadString(url) 通过 URL 获取 html 文档，但是很难找到我要查找的元素内容。在四处阅读的过程中，我发现了 HtmlDocument，它有一些简洁的东西，比如 GetElementById。如何使用 url 返回的 html 填充 HtmlDocument？

最佳答案

使用 Html 敏捷包 as suggested by SLaks ，这变得非常容易:

string html = webClient.DownloadString(url);
var doc = new HtmlDocument();
doc.LoadHtml(html);

HtmlNode specificNode = doc.GetElementById("nodeId");
HtmlNodeCollection nodesMatchingXPath = doc.DocumentNode.SelectNodes("x/path/nodes");

关于c# - 字符串到 HtmlDocument，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/4935446/

26

4

0

文章推荐： c# - 在 .net 4 中获取连接字符串

文章推荐： javascript - Javascript 中的虚函数

文章推荐： javascript - Google Chrome 扩展开发中的 ES6 模块(意外标记)

文章推荐： c# - 对实体的 linq 内部连接

javascript - HTMLDocument 函数是什么？
我注意到，如果你编写这样的程序: console.log(document); 它显示[object HTMLDocument]。然后，如果你这样做: console.log(HTMLDocument
java - HTMLDocument 迭代器跳过标签
我正在使用 HTMLDocument 迭代器来尝试迭代 HTMLDocument 中的所有 a 标记。然而，迭代器似乎跳过了嵌套在 p 标签内的 a 标签。例如: some site
c# - 在不使用浏览器控件的情况下从字符串获取 HtmlDocument
我使用 WebClient 获取网页的 html 代码(作为字符串)。但是我想将它变成一个 HtmlDocument 对象，这样我就可以使用这个类提供的 DOM 特性。目前我知道的唯一方法是使用浏览
C#:HtmlDocument 对象没有构造函数？
这是怎么回事？似乎获得有效 HtmlDocument 对象的唯一方法是复制 mshtml/webbrowser 控件的 Document 属性。但是产卵是sloooooooooooow。我想避免编写自
java - HTMLDocument 文本中位置或偏移量的含义
我试图了解位置/偏移量在 HTMLDocument 中的工作原理。描述了位置/偏移语义 here .我的解释是，这些是由 HTMLDocument 表示的屏幕字符序列中的索引。考虑来自 the HT
c# - 字符串到 HtmlDocument
我正在使用 WebClient.DownloadString(url) 通过 URL 获取 html 文档，但是很难找到我要查找的元素内容。在四处阅读的过程中，我发现了 HtmlDocument，它有
java - 为什么 HTMLDocument 会忽略空格
我有一个问题。看起来 HTMLEditorKit 只是忽略空格。这是我的示例代码: public class TestEditor extends JFrame { public TestEditor
c# - HtmlAgilityPack.HtmlDocument() 导致错误
在我的应用程序中，我想使用已使用 NuGet 安装的 HTMLAgilityPack。但是当我尝试创建 HtmlAgilityPack.HtmlDocument 实例时，我有 "Source not
java - HTMLDocument、HTMLEditorKit 和空格
当我运行以下代码时: import java.io.IOException; import java.io.Reader; import java.io.StringReader; import ja
c# - 通过 HtmlDocument.All 集合的迭代在引用的样式表处停止？
由于“.NET 中的错误”通常不是问题的真正原因，我想知道我是否遗漏了什么。我所做的感觉很简单。我正在遍历名为 doc 的 HtmlDocument 中的元素，如下所示: System.Diagno
java - 元素到 HTMLDocument 中的字符串
我有一个 Element 对象，它是一个 HTMLDocument 对象，我想将这个元素的值字符串化。我想要这个结果克里斯蒂娜·托特 (Christina Toth)，药学博士。 D. ======
javascript - 将 HTMLDocument 转换为可打印的字符串
我想将 Javascript DOM HTMLDcument 转换为可以写入文件的字符串。但是如何将 HTMLDocument 的字符串转换为 xml？! 更新如果可能的话，我希望看到应用任何动态
javascript - HtmlAgilityPack.HtmlDocument Cookies
这适用于在脚本内设置的 cookie(可能在脚本标签内)。 System.Windows.Forms.HtmlDocument 执行这些脚本并且可以通过其检索 cookie 集(如 document
java - 从 HTMLDocument 中获取单个元素的文本内容
我有一个将 HTMLEditorKit 设置为默认 editorKit 的 jTextPane。在 jTextPane 上调用 getDocument 返回一个 HTMLDocument 。我可以遍历
c# - HtmlDocument.Write 剥离引号
出于某种原因，当我尝试写入 HtmlDocument 时，它会去掉我给它的字符串的一些(不是全部)引号。看这里: HtmlDocument htmlDoc = Webbrowser1.Documen
C#.net 从控制台使用 HTMLDocument？
我正在尝试使用 System.Windows.Forms.HTMLDocument在控制台应用程序中。首先，这可能吗？如果是这样，我如何将网页从网络加载到其中？我正在尝试使用 WebBrowser ，
C# HtmlAgilityPack HtmlDocument() LoadHtml编码
Uri url = new Uri("http://localhost/rgm.php"); WebClient client = new WebClient(); string html = cli
c# - WPF 网页浏览器 HTMLDocument
我正在尝试注入(inject)一些 javascript 代码以防止弹出 javascript 错误，但我在 WPF 中找不到 HTMLDocument 和 IHTMLScriptElement: v
javascript - 序列化 HTMLDocument 然后在服务器中渲染它？
经过一些谷歌搜索，我没有找到任何满足我需要的东西。我想按原样保存当前网页。我的意思是，很多网页执行了 Javascript 并更改了 CSS，因此在一些用户交互之后，网页可能与第一次加载到浏览器时的网
dom - 如何使用 CefSharp 获取 HtmlDocument？
没有办法像 IE WebBrowser?WebBrowser.Document.GetElementById(string id); 那样获取 html 元素。我是 CefSharp 的新用户，谢谢

首页

博学

6Ren·AI

商城

c# - 字符串到 HtmlDocument