gpt4 book ai didi

r - 在 R 中从维基百科中提取特定表格

转载 作者:行者123 更新时间:2023-12-04 01:05:27 26 4
gpt4 key购买 nike

我想从维基百科页面中提取第 20 个表 https://en.wikipedia.org/wiki/.. .
我现在使用此代码,但它只提取第一个标题表。

the_url <- "https://en.wikipedia.org/wiki/..."
tb <- the_url %>% read_html() %>%
html_node("table") %>%
html_table(fill = TRUE)
我应该怎么做才能得到特定的?谢谢!!

最佳答案

您可以根据与 id 为 Prize_money 的元素的关系进行 anchor 定,而不是索引表位置可以移动的位置。只返回一个节点以提高效率。避免使用较长的 xpath,因为它们可能很脆弱。

library(rvest)

table <- read_html('https://en.wikipedia.org/wiki/2018_FIFA_World_Cup#Prize_money') %>%
html_node(xpath = "//*[@id='Prize_money']/parent::h4/following-sibling::table[1]") %>%
html_table(fill = T)

关于r - 在 R 中从维基百科中提取特定表格,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66626843/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com