gpt4 book ai didi

r - 使用 rvest 抓取图像标题

转载 作者:行者123 更新时间:2023-12-02 04:24:01 25 4
gpt4 key购买 nike

我正在尝试使用 R 中的 rvest 包和 SelectorGadget 来识别我的 CSS 选择器,从而从 Glassdoor(该 API 仅提供汇总评分)中提取个人评分。

问题是 Glassdoor 使用图像来传达评级,但数字评级包含在图像标题中。使用 SelectorGadget,我可以从下面的代码片段(使用“#EmployerReviews undecorated li”)中抓取“Comp & Benefits”文本,但我无法进入 span...title= 部分中的“2.0”,它是我想要的。

<div id='EmployerReviews'> .... <ul class='undecorated'> <li> <div class='minor'>Comp & Benefits</div> <span class='notranslate notranslate_title gdBars gdRatings med ' title="2.0"> 

有没有人在过去成功抓取图片标题,或者知道另一种获取这些个人评分的方法?

最佳答案

您需要选择跨度,并使用 html_attr() 提取其属性值:

html <- html("...")
rating <- html %>%
html_nodes("#EmployerReviews .undecorated li span.gdRatings") %>%
html_attr("title")

rating
# [1] "2.0"

关于r - 使用 rvest 抓取图像标题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28350833/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com