gpt4 book ai didi

javascript - 使用 .Net 在服务器端加载 DOM 并执行 javascript

转载 作者:数据小太阳 更新时间:2023-10-29 04:31:22 26 4
gpt4 key购买 nike

我想使用文档(字符串形式)或 URL 加载 DOM,然后对其执行 javascript 函数(包括 jquery 选择器)。这将完全是服务器端,在进程中,没有客户端/浏览器。

基本上我需要加载 dom,然后使用 jquery 选择器和 text() & type val() 函数从中提取字符串。我真的不需要操纵 dom。

我看过 Jurassic 和 Jint 等 .Net javascript 引擎,但都不支持加载 DOM,因此无法满足我的需要。

如果存在非 .Net 解决方案(node.js、ruby 等),我愿意考虑,但我更喜欢 .Net。

编辑下面是一个很好的答案,但目前我正在尝试不同的路线,我正在尝试将 envjs 移植到侏罗纪。如果我能让它工作,我想它会做我想做的,敬请期待....

最佳答案

答案取决于您要做什么。如果您的目标基本上是一个完整的 Web 浏览器模拟,或“ headless 浏览器”,则有许多解决方案,但(据我所知)没有一个完全存在于 .NET 中。要模仿浏览器,您需要一个 JavaScript 引擎和一个 DOM。您已经确定了一些引擎;我发现 Jurassic 是最强大和最快的。 google chrome V8 引擎也很受欢迎; Neosis Javascript.NET项目为其提供了一个 .NET 包装器。它不是很纯的 .NET,因为您有非 .NET 依赖项,但它集成得很干净,使用起来也不麻烦。

但是正如您所指出的,您仍然需要一个 DOM。在纯 C# 中有 XBrowser ,但它看起来有点陈旧。整个浏览器 DOM 有基于 javascript 的表示形式,例如 jsdom , 也。您或许可以在 Jurassic 中运行 jsdom,在没有浏览器的情况下为您提供 DOM 模拟,所有这些都在 C# 中进行(尽管可能非常慢!)它肯定会在 V8 中运行得很好。如果您走出 .NET 领域,还有其他更好的支持解决方案。 This question讨论 HtmlUnit。然后是Selenium用于自动化实际的网络浏览器。

另外,请记住,围绕这些工具所做的很多工作都是为了测试。虽然这并不意味着您不能将它们用于其他用途,但它们可能无法很好地执行或集成在内联生产代码中进行任何类型的稳定使用。如果您尝试基本上进行实时 HTML 操作,那么混合许多技术的解决方案可能不是一个糟糕的选择,这些技术除了测试之外没有被广泛使用。

如果您的需求实际上是 HTML 操作,它实际上并不需要使用 Javascript,但您更多地考虑 JS 中可用的此类工具的丰富性,那么我会看看为此目的设计的 C# 工具。例如HTML Agility Pack ,或者我自己的项目CsQuery ,这是一个 C# jQuery 端口。

如果您基本上是在尝试获取一些为客户端编写的代码,但在服务器上运行它——例如对于复杂/加速的网络抓取——我会使用这些术语进行搜索。例如this question对此进行了讨论,答案包括 PhantomJS ,一个 headless 的 webkit 浏览器堆栈,以及我已经提到的一些测试工具。对于 Web 抓取,我认为您可以在不使用 .NET 的情况下生活,无论如何这可能是唯一合理的答案。

关于javascript - 使用 .Net 在服务器端加载 DOM 并执行 javascript,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10886161/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com