gpt4 book ai didi

javascript - 如何使用 Html Agility Pack 的实际源代码获取 javascript 代码

转载 作者:行者123 更新时间:2023-11-29 19:14:34 25 4
gpt4 key购买 nike

我正在使用 Html Agility 包获取网站的源代码,这与我使用 firebug 检查时的代码不同。我已经搜索了很多东西,但仍然不清楚我应该做什么。源代码与我检查时的代码不同检查请告诉我如何使用该 Html 获取 javascript 代码。即使我在浏览器中禁用 javascript,我仍然无法从源代码中获取 Javascript 代码。我正在使用

string url="";
HtmlDocument doc = new HtmlDocument();
WebClient client = new WebClient();
html = client.DownloadString(url);
doc.LoadHtml(html);

要获取源代码,请告诉我是否也需要请求和响应方法来获取 JS 代码。

最佳答案

展开@alecxe回答,您可以像真正的浏览器一样使用 Selenium* 加载您的目标页面,然后将结果传递给 HtmlAgilityPack 进行进一步处理:

using OpenQA.Selenium;

.....

IWebDriver driver = new PhantomJS.PhantomJSDriver();
driver.Navigate().GoToUrl(url);
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(driver.PageSource);

或者,您可以直接使用 Selenium 运行查询(XPath 或 CSS 选择器),例如:

var result = driver.FindElements(By.XPath("your query"));

//print HTML of the returned elements
foreach (var item in result)
{
Console.WriteLine(item.GetAttribute("outerHTML"));
}

*) 需要先下载 Selenium,以及驱动程序,即 PhantomJS、Firefox 等。Selenium 可以从 NuGet 轻松安装到您的项目中。 .

关于javascript - 如何使用 Html Agility Pack 的实际源代码获取 javascript 代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36373252/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com