gpt4 book ai didi

python - 从网站中提取表格

转载 作者:太空宇宙 更新时间:2023-11-03 17:48:45 25 4
gpt4 key购买 nike

我多次尝试在该网站检索该表: http://www.whoscored.com/Players/845/History/Tomas-Rosicky(“历史参与”下的)

import urllib2 
from bs4 import BeautifulSoup
soup = BeautifulSoup(urllib2.urlopen('http://www.whoscored.com/Players/845/').read())

这是我用来检索表 html 的 Python 代码,但我得到的是空字符串。帮帮我吧!

最佳答案

所需的表是通过对http://www.whoscored.com/StatisticsFeed/1/GetPlayerStatistics端点请求的异步API调用形成的,该请求返回一个JSON 响应。换句话说,urllib2 将返回页面的初始 HTML 内容,不含“动态”部分。换句话说,urllib2 不是浏览器。

您可以使用浏览器开发人员工具研究该请求:

enter image description here

现在,您需要在代码中模拟此请求。 requests package是您应该考虑使用的东西。

这是一个关于 whoscored.com 的类似问题,我之前已经回答过,这里有一个示例工作代码,您可以将其用作起点:

关于python - 从网站中提取表格,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29375475/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com