gpt4 book ai didi

Javascript 模拟器

转载 作者:太空狗 更新时间:2023-10-29 22:52:26 31 4
gpt4 key购买 nike

有谁知道一个小型、快速、支持 DOM 层的 javascript 模拟器?在 C/C++ 中?

问题:我需要在爬虫应用程序中对 javascript 的基本支持,并且想知道除了以下选项之外是否还有其他选项:

a) 集成 WebKit( headless )(极大地减慢了爬行速度)。b) 集成 SpiderMonkey 并自己编写 DOM 层(不期待这个选项,不确定它是否值得,速度方面)。

还有其他选择吗?

谢谢!

最佳答案

投下我对 WebKit(或其他一些现有代码)的投票。为什么要费心重新发明轮子,尤其是当轮子真的很花哨、复杂,已经花了多年的时间开发时。

如果您真的想要,您可以先编写一些代码来检查 javascript,这样您就可以只传递需要它的作业。然后,为要忽略的常见广告网络和分析包编写过滤器。但是,如果是我,我宁愿与我的爬行方式保持一致。

此外,不要认为您只需要基本 支持,因为有一些非常时髦的网站会进行大量 DOM 更改。如果您希望您的抓取是可靠的,请准备好支持浏览器支持的内容。最简单的方法是使用浏览器正在使用的相同代码。

关于Javascript 模拟器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4236411/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com