Rselenium - 如何抓取所有下拉列表选项值-6ren

Rselenium - 如何抓取所有下拉列表选项值

转载作者：行者123 更新时间：2023-12-02 20:56:51

24

4

如何使用 Rselenium 抓取下拉列表中的所有选项值？

页面源代码示例:

<select name="main$ddArea" onchange="javascript:setTimeout(&#39;__doPostBack(\&#39;main$ddArea\&#39;,\&#39;\&#39;)&#39;, 0)" id="main_ddArea" class="groupTextBox">
<option selected="selected" value="95182">Area 1</option>
<option value="95183">Area 2</option>
<option value="95184">Area 3</option>
<option value="95185">Area 4</option>
<option value="95186">Area 4</option>
</select>

想要的结果是一个向量，每个值都是一个元素。例如，values = c("95182", "95183", "95184", "95185", "95186")

获取值的字符串也可能有效，因为它可以拆分为元素，例如，使用 strsplit。

带有“值”或“选项”的 getElementAttribute() 不起作用。例如，

dd.areas = remDr$findElement(using='id', value="main_ddArea")
dd.areas$getElementAttribute('option')

或

dd.areas$getElementAttribute('value')

getElementText() 找到文本的一个字符串，例如，“Area 1/n Area 2/n Area 3/n....”。但是文本以后不能用于导航下拉列表。换句话说，当使用 $findelement() 导航下拉列表时，需要一个值来填充下拉列表；文本不起作用。

package documentation似乎不包含对下拉列表的引用，vignette 也不包含.

最佳答案

您可以使用 findElement 定位 select 标签，然后获取 outerHTML 并解析生成的 html:

remDr$navigate("https://www.tutorialspoint.com/html/html_select_tag.htm")
webElem <- remDr$findElement("name", "dropdown")
appHTML <- webElem$getElementAttribute("outerHTML")[[1]]
doc <- htmlParse(appHTML)
doc["//option", fun = function(x) xmlGetAttr(x, "value")]

> doc["//option", fun = function(x) xmlGetAttr(x, "value")]
[[1]]
[1] "Data Structures"

[[2]]
[1] "Data Mining"

Firefox 和获取元素属性最近出现了一些问题，这些问题在使用基于 gecko 的浏览器运行 selenium server 2 时出现，请参阅 GetAttribute of WebElement in Selenium Firefox Driver Returns Empty .在这种情况下，您可以使用 JavaScript 获取属性

remDr$navigate("https://www.tutorialspoint.com/html/html_select_tag.htm")
webElem <- remDr$findElement("name", "dropdown")
jsScript <- "var element = arguments[0]; return element.outerHTML;"
appHTML <- remDr$executeScript(jsScript, list(webElem))[[1]]
doc <- htmlParse(appHTML)
doc["//option", fun = function(x) xmlGetAttr(x, "value")]

> doc["//option", fun = function(x) xmlGetAttr(x, "value")]
[[1]]
[1] "Data Structures"

[[2]]
[1] "Data Mining"

关于Rselenium - 如何抓取所有下拉列表选项值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39949809/

24

4

0

文章推荐： Docker 拉取存储库失败，错误为 : Too Many Requests (HAP429)

文章推荐： dataframe - Julia 数据帧 : Create new column sum of col values :x by :y

文章推荐： google-analytics - Google Analytics - 下载主机名表

文章推荐： php - 如何隐藏 woocommerce 中的特定消息？

rselenium - Rselenium 中的 rsDriver() 不起作用
我已将 r 更新到最新版本，并再次安装了 Rselenium。我尝试使用 rsDriver，但端口 4567 有问题。与 this 相同错误回溯: rd <-rsDriver(verbose =T
java - 带有 Tor 的 RSelenium 以及 Windows 上的新 RSelenium 版本
我找到了@jdharrison 关于如何在 Windows 上使用 RSelenium 启动 Tor 的绝妙答案: https://stackoverflow.com/a/39048970/78373
Rselenium - 弹出窗口
我想使用 RSelenium 和 Firefox 浏览器从网站下载文件。我做的一切都是正确的(导航，选择正确的元素并写下我想要的)；现在我单击“下载”按钮，然后会打开一个 Firefox 弹出窗口
RSelenium 找不到具有给定参数的元素
我正在使用 RSelenium 构建一个包含有关经理信息的数据框。我在选择下拉列表中的元素时遇到问题。我的代码如下: > require(RSelenium) > remDr remDr$open(
RSelenium:抓取加载缓慢的动态加载页面
我不确定是不是因为我的网速很慢，但我正在尝试抓取一个在您向下滚动页面时加载信息的网站。我正在执行一个转到页面末尾的脚本，并等待 Selenium/Chrome 服务器加载其他内容。服务器确实更新并加载
RSelenium:使用窗口句柄切换窗口
我一整天都在使用 RSelenium，但仍然到处遇到障碍。我当前的问题是使用代码 WebElemReports$clickElement() 单击链接并打开一个新窗口。我尝试调整“about:conf
Rselenium - 如何抓取所有下拉列表选项值
如何使用 Rselenium 抓取下拉列表中的所有选项值？页面源代码示例: Area 1 Area 2 Area 3 Area 4 Area 4 想要的结果是一个向量，每个值都是一个元素。例如，
RSelenium:使用窗口句柄切换窗口
我一整天都在使用 RSelenium，但仍然到处遇到障碍。我当前的问题是使用代码 WebElemReports$clickElement() 单击链接并打开一个新窗口。我尝试调整“about:conf
Rselenium - 如何抓取所有下拉列表选项值
如何使用 Rselenium 抓取下拉列表中的所有选项值？页面源代码示例: Area 1 Area 2 Area 3 Area 4 Area 4 想要的结果是一个向量，每个值都是一个元素。例如，
并行运行 RSelenium
我将如何并行运行RSelenium。以下是并行使用 rvest 的示例 library(RSelenium) library(rvest) library(magrittr) library(for
RSelenium 背后的代理
我正在尝试使用 RSelenium。这是我正在做的事情: library(RSelenium) driver<- rsDriver(browser=c("chrome")) remDr <- dri
RSelenium:服务器信号端口已在使用中
我在 RSelenium 中使用以下代码来打开浏览器。在我关闭浏览器，甚至通过运行 remDr$close() 关闭处理程序后，该端口仍在使用中。我必须转到终端并手动终止该进程，以便同一端口可用。是否
RSelenium:无法运行示例代码
我是 RSelenium 的新手，在使用“Introduction Vignette”中的以下示例时遇到了问题: remDr$navigate("http://www.r-project.org")
RSelenium:从下拉列表中选择选项
我使用 RSelenium 填写网络表单。要从下拉列表中选择一个选项，我使用以下命令: xpathoption <- paste0("//select[@id = '",samplepatient[p
RSelenium 不工作
我尝试使用以下命令安装和运行 R Selenium 包的简单示例: install.packages("RSelenium") library("RSelenium") startServer() c
RSelenium 无法连接到主机 rsDriver()
我正在尝试使用 RSelenium 抓取网站。但是，当我想连接到 Selenium 服务器时遇到问题。假设我使用 rsDriver() 命令启动 selenium 服务器和浏览器: rsDriver
r - RSelenium 中的不一致行为
在 Linux 上，RSelenium/Selenium似乎行为不正常。我手动启动服务器，它似乎启动正常。有时我可以从我的 R session 连接到它，有时我会收到错误消息。我还不能查明原因:相同的
RSelenium 错误 : NotConnectedException
SO (Question 1) 中已经提出了一些与此类似的问题。 , (Question 2) ，但没有一个得到答复(最后一个有@jdharrison 的相关评论，指示 OP 提出问题)。这是我的问题
html - RSelenium:在文本框中输入值
我希望使用 RSelenium 将一些基因名称输入到一个在线存储库中，该存储库为所述基因创建功能注释热图。但是，我正在努力研究如何将基因列表输入到文本框中以生成热图。这是文本框和与之关联的 htm
r - RSelenium-使用xpath选择父元素
我正在尝试使用RSelenium通过按钮捕获网页上可用的csv。相关的html是： Download 我可以通过其类选择i元素： remDr$findElement(using = 'css sel

首页

博学

6Ren·AI

商城

Rselenium - 如何抓取所有下拉列表选项值