- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试在 premier league player stats 中应用过滤器时复制请求.我注意到 url 在为 2019/20 赛季应用过滤器时添加了组件“?co=1&se=274”
https://www.premierleague.com//players/5140/Virgil-van-Dijk/stats?co=1&se=274
代替
https://www.premierleague.com//players/5140/Virgil-van-Dijk/stats
但是在做的时候
requests.get('https://www.premierleague.com//players/5140/Virgil-van-Dijk/stats?co=1&se=274')
并抓取内容,它被抓取就像没有应用过滤器一样。如何在网页上应用过滤器的地方发出请求?
通过深入研究,我了解到它受 CloudFront 保护,这意味着在发布请求之前所有查询参数都会被删除。有解决办法吗?
这是我抓取数据的方式:
from bs4 import BeautifulSoup as soup
import requests
from tqdm import tqdm
from pprint import pprint
players_url =['https://www.premierleague.com//players/5140/Virgil-van-Dijk/stats?co=1&se=274']
# this is dict where we store all information:
players = {}
for i in tqdm(players_url):
player_page = requests.get(i)
cont = soup(player_page.content, 'lxml')
time.sleep(2)
data = dict((k.contents[0].strip(), v.get_text(strip=True)) for k, v in zip(cont.select('.topStat span.stat, .normalStat span.stat'), cont.select('.topStat span.stat > span, .normalStat span.stat > span')))
clud_ele = cont.find('div', attrs={'class' : 'info'})
club = {"Club" : clud_ele.get_text(strip=True)}
position = {"Position": clud_ele.find_next('div', attrs={'class' : 'info'}).get_text(strip=True)}
data.update(club)
data.update(position)
players[cont.select_one('.playerDetails .name').get_text(strip=True)] = data
pprint(players)
在输出中我可以清楚地看到没有应用过滤器,因为本赛季还没有 45 场比赛
{'Virgil van Dijk': {'Accurate long balls': '533',
'Aerial battles lost': '207',
'Aerial battles won': '589',
'Appearances': '122',
'Assists': '2',
'Big chances created': '11',
'Blocked shots': '23',
'Clean sheets': '45',
最佳答案
您可以通过复制当您尝试按季节过滤时完成的后台请求来解决这个问题。我使用 requests
库来获取所有玩家的统计数据。
这个过程主要涉及三个url,
(例如 274)
https://footballapi.pulselive.com/football/competitions/1/compseasons?page=0&pageSize=100
(例如姓名:Virgil van Dijk,ID:5140)
https://footballapi.pulselive.com/football/players
(例如 5140)获取玩家统计数据
https://footballapi.pulselive.com/football/stats/player/
完整脚本
import requests
import json
response = requests.get('https://footballapi.pulselive.com/football/competitions/1/compseasons?page=0&pageSize=100').json() # request to obtain the id values and corresponding season
id = int(response["content"][0]["id"]) # converts current season id which is a decimal point value to interger
players = {} # dictionary to store players data
playersAndStats = {} # dictionary to store player name and associated stats
numEntries = 100
page = 0
# loop to get player name and id
while True:
params = (
('pageSize', '100'),
('compSeasons', str(id)),
('altIds', 'true'),
('page', str(page)),
('type', 'player'),
('id', '-1'),
('compSeasonId', str(id)),
)
response = requests.get('https://footballapi.pulselive.com/football/players',params=params).json()
playersData = response["content"]
for playerData in playersData:
players[playerData["id"]] = playerData["name"]["display"]
page += 1
if page == response["pageInfo"]["numPages"]:
break
print("Total no. of players :",len(players))
count = 0
total = len(players)
# loop to get player stats
for player in players:
count += 1
print(count,"/",total)
params = (
('comps', '1'),
('compSeasons', str(id)), # setting season id to current season id
)
playerId = str(int(player))
# gets the stat of the player using playerId
response = requests.get('https://footballapi.pulselive.com/football/stats/player/'+playerId,params=params).json()
stats = response["stats"]
# creating a stat dict for the player
playersAndStats[players[player]] = {}
# loop to store each stat associated with the player
for stat in stats:
playersAndStats[players[player]][stat["name"].replace("_"," ").capitalize()] = int(stat["value"])
# to store data to a json file
f = open("data.json","w")
# pretty prints and writes the same to the json file
f.write(json.dumps(playersAndStats,indent=4, sort_keys=True))
f.close()
print("Saved to data.json")
示例输出
"Aaron Connolly": {
"Accurate back zone pass": 1,
"Accurate fwd zone pass": 1,
"Accurate pass": 2,
"Aerial lost": 1,
"Appearances": 1,
"Attempts conceded ibox": 2,
"Attempts conceded obox": 1,
"Backward pass": 1,
"Ball recovery": 1,
"Duel lost": 1,
"Duel won": 0,
"Final third entries": 1,
"Goals conceded": 1,
"Goals conceded ibox": 1,
"Losses": 1,
"Mins played": 24,
"Open play pass": 1,
"Poss won mid 3rd": 1,
"Rightside pass": 1,
"Successful final third passes": 1,
"Successful open play pass": 1,
"Total back zone pass": 1,
"Total final third passes": 1,
"Total fwd zone pass": 1,
"Total offside": 2,
"Total pass": 2,
"Total sub on": 1,
"Total tackle": 0,
"Touches": 3,
"Won tackle": 0
}
data.json 文件包含所有玩家的数据。
The stats associated with each player varies according to their playing position.
关于python - 在网页上应用过滤器时如何复制请求?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57732504/
我正在通过 labrepl 工作,我看到了一些遵循此模式的代码: ;; Pattern (apply #(apply f %&) coll) ;; Concrete example user=> (a
我从未向应用商店提交过应用,但我会在不久的将来提交。 到目前为止,我对为 iPhone 而非 iPad 进行设计感到很自在。 我了解,通过将通用PAID 应用放到应用商店,客户只需支付一次就可以同时使
我有一个应用程序,它使用不同的 Facebook 应用程序(2 个不同的 AppID)在 Facebook 上发布并显示它是“通过 iPhone”/“通过 iPad”。 当 Facebook 应用程序
我有一个要求,我们必须通过将网站源文件保存在本地 iOS 应用程序中来在 iOS 应用程序 Webview 中运行网站。 Angular 需要服务器来运行应用程序,但由于我们将文件保存在本地,我们无法
所以我有一个单页客户端应用程序。 正常流程: 应用程序 -> OAuth2 服务器 -> 应用程序 我们有自己的 OAuth2 服务器,因此人们可以登录应用程序并获取与用户实体关联的 access_t
假设我有一个安装在用户设备上的 Android 应用程序 A,我的应用程序有一个 AppWidget,我们可以让其他 Android 开发人员在其中以每次安装成本为基础发布他们的应用程序推广广告。因此
Secrets of the JavaScript Ninja中有一个例子它提供了以下代码来绕过 JavaScript 的 Math.min() 函数,该函数需要一个可变长度列表。 Example:
当我分别将数组和对象传递给 function.apply() 时,我得到 NaN 的 o/p,但是当我传递对象和数组时,我得到一个数字。为什么会发生这种情况? 由于数组也被视为对象,为什么我无法使用它
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界. 这篇CFSDN的博客文章ASP转换格林威治时间函数DateDiff()应用由作者收集整理,如果你
我正在将列表传递给 map并且想要返回一个带有合并名称的 data.frame 对象。 例如: library(tidyverse) library(broom) mtcars %>% spl
我有一个非常基本的问题,但我不知道如何实现它:我有一个返回数据框,其中每个工具的返回值是按行排列的: tmp<-as.data.frame(t(data.frame(a=rnorm(250,0,1)
我正在使用我的 FB 应用创建群组并邀请用户加入我的应用群组,第一次一切正常。当我尝试创建另一个组时,出现以下错误: {"(OAuthException - #4009) (#4009) 在有更多用户
我们正在开发一款类似于“会说话的本”应用程序的 child 应用程序。它包含大量用于交互式动画的 JPEG 图像序列。 问题是动画在 iPad Air 上播放正常,但在 iPad 2 上播放缓慢或滞后
我关注 clojure 一段时间了,它的一些功能非常令人兴奋(持久数据结构、函数式方法、不可变状态)。然而,由于我仍在学习,我想了解如何在实际场景中应用,证明其好处,然后演化并应用于更复杂的问题。即,
我开发了一个仅使用挪威语的应用程序。该应用程序不使用本地化,因为它应该仅以一种语言(挪威语)显示。但是,我已在 Info.plist 文件中将“本地化 native 开发区域”设置为“no”。我还使用
读完 Anthony's response 后上a style-related parser question ,我试图说服自己编写单体解析器仍然可以相当紧凑。 所以而不是 reference ::
multicore 库中是否有类似 sapply 的东西?还是我必须 unlist(mclapply(..)) 才能实现这一点? 如果它不存在:推理是什么? 提前致谢,如果这是一个愚蠢的问题,我们深表
我喜欢在窗口中弹出结果,以便更容易查看和查找(例如,它们不会随着控制台继续滚动而丢失)。一种方法是使用 sink() 和 file.show()。例如: y <- rnorm(100); x <- r
我有一个如下所示的 spring mvc Controller @RequestMapping(value="/new", method=RequestMethod.POST) public Stri
我正在阅读 StructureMap关于依赖注入(inject),首先有两部分初始化映射,具体类类型的接口(interface),另一部分只是实例化(请求实例)。 第一部分需要配置和设置,这是在 Bo
我是一名优秀的程序员,十分优秀!