gpt4 book ai didi

webkit - 构建网络爬虫——使用 Webkit 包

转载 作者:塔克拉玛干 更新时间:2023-11-02 21:37:55 34 4
gpt4 key购买 nike

我正在尝试构建网络爬虫。
我需要两件事:

  • 将 HTML 转换为 DOM 对象。
  • 按需执行现有的 JavaScript。
我期望的结果是一个 DOM 对象,其中执行加载的 JavaScript 已经执行。
此外,我需要一个选项来按需执行额外的 JavaScript(在诸如 onMouseOveronMouseClick 等事件上)首先,我找不到好的文档来源。
我搜索了 Webkit Main Page但找不到该包用户的太多信息,也没有有用的代码示例。另外,在一些论坛上,我看到说明不使用爬虫的 Webkit 接口(interface),而是直接使用 DOM 和 Javascript 内包。

我正在搜索 文档代码示例
此外,关于正确使用的任何建议。

工作环境:
  • 操作系统:Windows
  • 语言:C++

最佳答案

查看与 WebKit 主干一起打包的一些测试工具。大多数端口(据我所知)包括 DumpRenderTree,它实例化 WebKitView,然后在处理指定文件后吐出渲染树。从理论上讲,它是 WebKit 可能的最简单示例之一。

关于webkit - 构建网络爬虫——使用 Webkit 包,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/162181/

34 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com