gpt4 book ai didi

c# - 从 javascript 获取带有渲染的 html 的网页源代码

转载 作者:太空狗 更新时间:2023-10-29 23:47:15 26 4
gpt4 key购买 nike

如果我用这个

WebClient client = new WebClient();
String htmlCode = client.DownloadString("http://test.net");

我能够使用敏捷包扫描 html 并获得我需要的大部分标签,但它缺少由 javascript 呈现的 html。

我的问题是,如何使用 C# 获取最终呈现的页面源代码。在运行 javascript 后,WebClient 是否有更多的东西来获取最终呈现的源?

最佳答案

仅靠 HTML Agility Pack 是不够的,您还需要一个 javascript 引擎。为此,您可能需要查看 Geckofx 之类的东西,它允许您将功能齐全的 Web 浏览器嵌入到您的应用程序中,并且允许您在页面呈现后以编程方式访问 dom 的内容。

http://code.google.com/p/geckofx/

关于c# - 从 javascript 获取带有渲染的 html 的网页源代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12201791/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com