作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用 Rselenium 和 rvest 抓取一些网站。因此,我循环浏览下拉菜单的元素以更改 javascript 表。下拉菜单中的表名应该成为我在抓取表中的标识符列。我设法抓取了表格,但在只抓取一个选定的菜单项时我被卡住了。以下是一些 html 代码行:
<select>
<option value="5823">2010/2011</option>
<option value="7094">2011/2012</option>
<option value="9024">2012/2013</option>
<option value="11976">2013/2014</option>
<option value="15388">2014/2015</option>
<option value="18336" selected="selected">2015/2016</option>
</select>
如何获取所选列的 html_text? css 选择器 :checked 不起作用。我试过:
html_nodes("option") %>% html_attrs()
哪个正确地给了我:
[[1]]
value
"5823"
[[2]]
value
"7094"
[[3]]
value
"9024"
[[4]]
value
"11976"
[[5]]
value
"15388"
[[6]]
selected value
"selected" "18336"
和
read_html(wData) %>% html_nodes("option") %>% html_text()
[1] "2010/2011" "2011/2012" "2012/2013" "2013/2014" "2014/2015" "2015/2016"
但我不知道如何将两者结合在一起。我只得到:
[1] "2015/2016"
因为我然后循环浏览选项,所以我需要一个通用的解决方案。谢谢。
最佳答案
您可以使用 xpath
选择器而不是 css 选择器。
read_html(wData) %>% html_nodes(xpath="//option[@selected]") %>% html_text()
即使 :checked
css 伪类不起作用,这也允许您搜索属性。
关于css - 使用 rvest 抓取所选下拉项的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35461079/
我正在尝试用 Swift 编写这段 JavaScript 代码:k_combinations 到目前为止,我在 Swift 中有这个: import Foundation import Cocoa e
我是一名优秀的程序员,十分优秀!