gpt4 book ai didi

r - 使用 rvest 进行网络抓取时如何修复 R 'Error in UseMethod("xml_find_all")' 中的以下错误?

转载 作者:行者123 更新时间:2023-12-02 16:50:29 27 4
gpt4 key购买 nike

我是 R 的新手,目前正在完成一项处理网络抓取的任务。

我应该读入此网页中的所有句子:https://www.cs.columbia.edu/~hgs/audio/harvard.html

这是我当前的代码:

library(xml2)
library(rvest)
url <- 'https://www.cs.columbia.edu/~hgs/audio/harvard.html'
read_html(url)
sentences <- url %>%
html_nodes("li") %>%
html_text()

每次我运行它,我都会得到这个错误:

Error in UseMethod("xml_find_all") : no applicable method for 'xml_find_all' applied to an object of class "character"

你能帮帮我吗?我不明白我做错了什么。

最佳答案

您忘记为 read_html(url) 分配一个变量(我想它应该是相同的 url)。所以 url %>% html_nodes("li") 正在读取一个“字符串”而不是一个“xml_document”,这是错误告诉你的(内部,rvest::html_nodes 调用函数 xml2::xml_find_all)。

你可以这样做:

html <- read_html(url)

sentences <- html%>%
html_nodes("li") %>%
html_text()

或者这个,如果你只读一次url

sentences <- read_html(url) %>%
html_nodes("li") %>%
html_text()

关于r - 使用 rvest 进行网络抓取时如何修复 R 'Error in UseMethod("xml_find_all")' 中的以下错误?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58921479/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com