gpt4 book ai didi

r - 如何将 html 表导入 R?

转载 作者:行者123 更新时间:2023-12-04 07:56:58 25 4
gpt4 key购买 nike

我只是想将一个 html 表导入 R。我尝试了其他人的错误并广泛查看了给出的解决方案,尽管我的问题仍然出现。我知道这很容易,但是由于某种原因,它对我不起作用。我收到以下错误:
错误:无法加载外部实体“http://www.formula1.com/en/results.html/2020/races/1045/austria/race-result.html”(第一个功能)
(function (classes, fdef, mtable) 中的错误:
无法找到签名“NULL”的函数“readHTMLTable”的继承方法(第二个)
正如我所提到的,我已经查看了其他人的问题并尝试使用他们的解决方案来解决我的问题,尽管仍然出现相同的问题。也许这可能是由于我的设置(我不确定),但是有人可以帮助我吗?

library(XML)
library(rjson)
library(RCurl)
library(htmltools)

url<- "http://www.formula1.com/en/results.html/2020/races/1045/austria/race-result.html"
austria = readHTMLTable(url, which=1)

tabs <- getURL("http://www.formula1.com/en/results.html/2020/races/1045/austria/race-result.html")
tabs1 <- readHTMLTable(tabs, which=1)

最佳答案

rvest您可以使用 html_table从页面获取表格:

library(rvest)

url <- 'https://www.formula1.com/en/results.html/2020/races/1045/austria/race-result.html'
url %>%
read_html %>%
html_table() %>%
.[[1]] -> df

df

# Pos No Driver
#1 NA 1 77 Valtteri\n Bottas\n BOT
#2 NA 2 16 Charles\n Leclerc\n LEC
#3 NA 3 4 Lando\n Norris\n NOR
#4 NA 4 44 Lewis\n Hamilton\n HAM
#5 NA 5 55 Carlos\n Sainz\n SAI
#6 NA 6 11 Sergio\n Perez\n
#...
#...

# Car Laps Time/Retired PTS
#1 Mercedes 71 1:30:55.739 25 NA
#2 Ferrari 71 +2.700s 18 NA
#3 McLaren Renault 71 +5.491s 16 NA
#4 Mercedes 71 +5.689s 12 NA
#5 McLaren Renault 71 +8.903s 10 NA
#6 Racing Point BWT Mercedes 71 +15.092s 8 NA
#...
#...

关于r - 如何将 html 表导入 R?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66651863/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com