作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想从维基百科页面中提取第 20 个表 https://en.wikipedia.org/wiki/.. .
我现在使用此代码,但它只提取第一个标题表。
the_url <- "https://en.wikipedia.org/wiki/..."
tb <- the_url %>% read_html() %>%
html_node("table") %>%
html_table(fill = TRUE)
我应该怎么做才能得到特定的?谢谢!!
最佳答案
您可以根据与 id 为 Prize_money 的元素的关系进行 anchor 定,而不是索引表位置可以移动的位置。只返回一个节点以提高效率。避免使用较长的 xpath,因为它们可能很脆弱。
library(rvest)
table <- read_html('https://en.wikipedia.org/wiki/2018_FIFA_World_Cup#Prize_money') %>%
html_node(xpath = "//*[@id='Prize_money']/parent::h4/following-sibling::table[1]") %>%
html_table(fill = T)
关于r - 在 R 中从维基百科中提取特定表格,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66626843/
我是一名优秀的程序员,十分优秀!