gpt4 book ai didi

html - 使用 R 从 tspan 类标签 HTML 中提取文本/数字

转载 作者:行者123 更新时间:2023-12-04 01:33:41 25 4
gpt4 key购买 nike

我正在尝试从此网站中提取当前生产编号 http://okg.se/sv/Produktionsinformation/ (在下面的蓝色区域)。

这是我需要使用的 HTML 代码部分:

<tspan dy="0" style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);">518</tspan>

我使用的代码示例:
url <- "http://okg.se/sv/Produktionsinformation//"
download.file(url, destfile = "scrapedpage.html", quiet=TRUE)
content <- read_html("scrapedpage.html")
content %>% html_nodes(".content__info__item__value")

但是我得到的结果表明没有可用的节点:
{xml_nodeset (0)}

你对如何解决这个问题有什么想法吗?

提前致谢!

最佳答案

我不太确定你需要的值(value),但这项工作

librar(rvest)

# page url
url <- "http://okg.se/sv/Produktionsinformation/"

# current value
read_html(url) %>%
html_nodes(".footer__gauge") %>%
html_attr("data-current")

# Max value
read_html(url) %>%
html_nodes(".footer__gauge") %>%
html_attr("data-max")

关于html - 使用 R 从 tspan 类标签 HTML 中提取文本/数字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60320908/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com