gpt4 book ai didi

r - 网页抓取需要点击鼠标?

转载 作者:行者123 更新时间:2023-12-04 20:15:32 25 4
gpt4 key购买 nike

我正在尝试(在 R 中)从以下位置抓取一些数据:

http://www.soccerbase.com/matches/results.sd?date=2012-11-04

即,我想获得当您按下 i 按钮时出现在页面上的比赛详情。但是,点击按钮时出现的信息并不包含在原始 html 代码中。我只能看到一条线(我希望包含数据的地方)...

<span class="infoField"><a href="#" class="info finished" title="Show full match details"></a></span>

......这几乎让我陷入了死胡同......有什么想法吗?

最佳答案

require(XML)
require(RCurl)
dataurl<-'http://www.soccerbase.com/matches/results.sd?date=2012-11-04'
sdata<-htmlParse(dataurl)
sid<-xpathSApply(sdata,'//*/tr/@id')
sid<-gsub('^tgc','',sid)
mUrl<-paste0('http://www.soccerbase.com/matches/additional_information.sd?id_game=',sid)

上面的代码将获得额外数据所需的 url。但是,我会与该网站核实有关收集他们的数据的信息。

关于r - 网页抓取需要点击鼠标?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13252231/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com