gpt4 book ai didi

r - 使用 rvest 添加新字段到表单

转载 作者:行者123 更新时间:2023-12-02 03:04:18 25 4
gpt4 key购买 nike

我正在尝试使用 rvest 下载[完整]动态扩展的[holdings]表,但收到未知字段名称错误。

s <- html_session("http://innovatoretfs.com/etf/?ticker=ffty")
f <- html_form(s)[[1]]
#the following line fails:
f.new <- set_values(f, `__EVENTTARGET` = "ctl00$BodyPlaceHolder$ViewHoldingsLinkButton")

##subsequent lines are not tested##
doc <- submit_form(s, f.new)
tabs <- xml_find_all(doc, "//table")
holdings <- html_table(tabs, fill = T, trim = T)[[5]]

我不太擅长 HTML/HTTP,但从我可以追踪的情况来看,在我看来,要扩展表格需要使用这个新字段值集回发表单

检查set_values函数后,它似乎只允许为现有字段赋值。

有什么方法可以向 rvest 下的表单添加新字段吗?如果没有,有人知道我可以使用另一个软件包来获得此功能吗?

[编辑]非常明确地表明我需要动态扩展表的完整版本并添加预期的后续表提取代码

最佳答案

令人厌恶,但有效可能会被清理,但会向项目提交问题以正确修复 add_values 类型功能

getInnovatorHoldings <- function() {
s <- html_session("http://innovatoretfs.com/etf/?ticker=ffty")
f <- html_form(s)[[1]]
f.new <- add_values(f,
`__EVENTTARGET` = "ctl00$BodyPlaceHolder$ViewHoldingsLinkButton",
`__EVENTARGUMENT` = "",
`submit` = NULL)

s <- submit_form(s, f.new, "submit")
doc <- read_html(s)
tabs <- xml_find_all(doc, "//table")
holdings <- html_table(tabs, fill = T, trim = T)[[5]]
return(holdings)
}

add_values <- function(form, ...) {
new_values <- list(...)
no_match <- which(!names(new_values) %in% names(form$fields))
for (n in no_match) {
if (names(new_values[n]) == "submit") {
form$fields[[names(new_values[n])]] <- new_input(name = names(new_values[n]), type = "submit", value = NULL)
} else {
form$fields[[names(new_values[n])]] <- new_input(name = names(new_values[n]), type = "hidden", value = new_values[n][[1]])
}
}
return(form)
}

new_input <- function(name, type, value, checked = NULL, disabled = NULL, readonly = NULL, required = F) {
return(
structure(
list(name = name,
type = type,
value = value,
checked = checked,
disabled = disabled,
readonly = readonly,
required = required
),
class = "input"
)
)
}

关于r - 使用 rvest 添加新字段到表单,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51352697/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com