gpt4 book ai didi

javascript - 查询选择器全部在 rvest 包中

转载 作者:行者123 更新时间:2023-11-30 00:03:53 28 4
gpt4 key购买 nike

我尝试执行这个 javascript 命令:

document.querySelectorAll('div.Dashboard-section div.pure-u-1-1 span.ng-scope')[0].innerText

在 r 中使用以下代码使用 rvest 包:

library(rvest)

url <- read_html("")

url %>%
html_nodes("div.Dashboard-section div.pure-u-1-1 span.ng-scope") %>%
html_text()

但我认为这是结果:

character(0)

我期待的是:

"Displaying results 1-25 of 10,897"

我能做什么?

最佳答案

简而言之,rvest 包可以获取 HTML,但不能执行 Javascript。您尝试获取的页面通过 AJAX、javascript 加载数据。

作为解决方法,您可以使用 RSelenium 包,正如用户 neoFox 所建议的那样。 Selenium Webdriver 会为您启动 Firefox 或 Chrome,导航到页面,等待它加载。并从 HTML DOM 中获取数据片段。

或者使用更小的 phantomjs headless 浏览器,它将 HTML 页面下载到 html 文件,而不弹出浏览器 GUI。 Read in and parse下载的带有 R 的 HTML 文件。

两者都需要一些严格的配置。 Selenium 是基于 Java 的。Phantomjs 需要至少阅读它的文档。

您还可以检查页面,找出站点发出的 POST 请求,然后自己发送此 POST。然后获取它返回的 JSON 并自己计算结果项。

关于javascript - 查询选择器全部在 rvest 包中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39250571/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com