- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用 BeautifulSoup 来抓取 this 上的“Season Stats”表页。有什么办法可以将整张 table 变成一个汤对象吗?目前我的代码是这样的:
seasonStats = soup.find('table', {'id': 'statsTable'})
categoryList = seasonStats.findAll('tr')[2].findAll('a')
我遇到的问题是 FG%、FT%、3PM、REB、AST、STL、BLK、TO、PTS 存储在一行中,但 RK、LAST、MOVES 存储在另一行中。无论如何我可以正确地抓取整个表,其中 RK、TEAM、FG%、FT%、3PM、REB、AST、STL、BLK、TO、PTS、LAST、MOVES 都存储在一行(categoryList)中? ESPN 甚至将这些值放在不同的行中,这似乎很愚蠢。此外,如果我能将整个表格整合到一个矩阵中,那将是非常有帮助的。
期望的输出:
['RK', 'TEAM', 'FG%', 'FT%', '3PM', 'REB', 'AST', 'STL', 'BLK', 'TO', 'PTS', 'LAST', 'MOVES']
['1', 'Team Li', '.4656', '.8049', '437', '1752', '962', '284', '228', '578', '4804', '4-4-1', '12']
['2', 'Team Aguilar', '.4499', '.7727', '415', '1925', '737', '276', '292', '543', '4901', '4-4-1', '0']
['3', 'Suck MyDirk', '.4533', '.8083', '410', '1798', '1035', '367', '153', '658', '5331', '3-6-0', '8']
['4', 'Knicks Tape', '.4589', '.8057', '339', '1458', '1029', '285', '132', '566', '4304', '4-5-0', '12']
['5', 'Kris Kaman His Pants', '.4576', '.8068', '534', '1530', '940', '306', '115', '515', '4603', '5-4-0', '17']
['6', 'Nutz Vs. Draymond Green', '.4518', '.8000', '404', '1641', '1004', '270', '176', '620', '4554', '5-4-0', '12']
['7', 'Team Keyrouze', '.4548', '.7895', '441', '1558', '809', '293', '195', '510', '4874', '4-5-0', '11']
['8', 'In Porzingod We Trust', '.4607', '.7542', '275', '1699', '1020', '274', '252', '482', '4119', '6-3-0', '13']
['9', 'Team Iannetta', '.4706', '.7908', '260', '1800', '1026', '310', '137', '646', '4909', '8-1-0', '13']
['10', "Jesse's Blue Balls", '.4646', '.6766', '403', '2029', '505', '243', '238', '481', '3929', '5-4-0', '16']
['11', 'Team Pauls 2 da Wall', '.4531', '.7602', '313', '1797', '1197', '313', '268', '525', '3719', '6-3-0', '13']
['12', 'YOU REACH, I TEACH', '.4552', '.7591', '401', '1488', '997', '285', '108', '521', '3694', '4-5-0', '12']
['13', 'Team Noey', '.4740', '.7610', '273', '1821', '681', '301', '226', '491', '4059', '3-6-0', '9']
['14', 'Team Jackson', '.4325', '.7484', '206', '1104', '714', '174', '101', '383', '2532', '1-8-0', '4']
当前输出:
['1', 'Team Li', '.4656', '.8049', '437', '1752', '962', '284', '228', '578', '4804', '4-4-1', '12']
['2', 'Team Aguilar', '.4499', '.7727', '415', '1925', '737', '276', '292', '543', '4901', '4-4-1', '0']
['3', 'Suck MyDirk', '.4533', '.8083', '410', '1798', '1035', '367', '153', '658', '5331', '3-6-0', '8']
['4', 'Knicks Tape', '.4589', '.8057', '339', '1458', '1029', '285', '132', '566', '4304', '4-5-0', '12']
['5', 'Kris Kaman His Pants', '.4576', '.8068', '534', '1530', '940', '306', '115', '515', '4603', '5-4-0', '17']
['6', 'Nutz Vs. Draymond Green', '.4518', '.8000', '404', '1641', '1004', '270', '176', '620', '4554', '5-4-0', '12']
['7', 'Team Keyrouze', '.4548', '.7895', '441', '1558', '809', '293', '195', '510', '4874', '4-5-0', '11']
['8', 'In Porzingod We Trust', '.4607', '.7542', '275', '1699', '1020', '274', '252', '482', '4119', '6-3-0', '13']
['9', 'Team Iannetta', '.4706', '.7908', '260', '1800', '1026', '310', '137', '646', '4909', '8-1-0', '13']
['10', "Jesse's Blue Balls", '.4646', '.6766', '403', '2029', '505', '243', '238', '481', '3929', '5-4-0', '16']
['11', 'Team Pauls 2 da Wall', '.4531', '.7602', '313', '1797', '1197', '313', '268', '525', '3719', '6-3-0', '13']
['12', 'YOU REACH, I TEACH', '.4552', '.7591', '401', '1488', '997', '285', '108', '521', '3694', '4-5-0', '12']
['13', 'Team Noey', '.4740', '.7610', '273', '1821', '681', '301', '226', '491', '4059', '3-6-0', '9']
['14', 'Team Jackson', '.4325', '.7484', '206', '1104', '714', '174', '101', '383', '2532', '1-8-0', '4']
非常感谢。
最佳答案
我想你错了。一个团队的所有数据看起来都在同一个 tr
中。这是第一个,删除了所有样式:
<tr>
<td id="sovrRk_9">1</td>
<td><a title="Team Li (Royce Li)" href="...">Team Li</a></td>
<td><spacer type="block" width="1" height="1"> </spacer>
</td>
<td id="tmTotalStat_9_19">.4656</td>
<td id="tmTotalStat_9_20">.8049</td>
<td id="tmTotalStat_9_17">437</td>
<td id="tmTotalStat_9_6">1752</td>
<td id="tmTotalStat_9_3">962</td>
<td id="tmTotalStat_9_2">284</td>
<td id="tmTotalStat_9_1">228</td>
<td id="tmTotalStat_9_11">578</td>
<td id="tmTotalStat_9_0">4804</td>
<td>4-4-1</td>
<td title="Season Moves">12</td>
</tr>
一切都在那里。
关于Python - 使用 BeautifulSoup 抓取 ESPN 表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41254231/
我一直在看ESPN API .但是,我无法找到有关如何获取 API KEY 的文档。 Getting Started中什么都没有关于获取 API key 的部分。此外,我登录 ESPN 并转到我的帐户
对编程相当陌生,抱歉,问题很广泛。 import requests from bs4 import BeautifulSoup def data(): League = ['nba', 'nf
我搜索了http://espn.go.com/apis/devcenter/但找不到任何可以创建 API key 的地方。我还在 ESPN 创建了一个帐户,但没有运气。 最佳答案 4 个月前未公开 (
我如何获得世界各地所有体育比赛的比分和赛程信息?我见过 ESPN API,但它仅适用于战略合作伙伴。 对于此类信息,是否有其他解决方案、API 或 RSS 提要? 最佳答案 如果你想要一些免费的东西,
我正在尝试使用 Selenium 自动执行 ESPN 上的某些任务,并且我首先需要登录我的帐户,因为当我尝试访问 ESPN 页面时,我会被重定向到登录页面。这是登录表单: MEMB
我正在尝试提取所有大学橄榄球队名单的数据,因为我想根据名单的组成对球队的表现进行一些分析。 我的脚本正在第一页上运行,它会迭代每个团队,并可以打开每个团队的名册链接,但随后我在团队的名册页面上运行的
我正在使用 R(和 RSelenium)从 ESPN 抓取数据。这不是我第一次使用它,但在这种情况下我遇到了错误,并且无法解决这个问题。 考虑此页面:http://en.espn.co.uk/prem
我正在尝试使用 BeautifulSoup 来抓取 this 上的“Season Stats”表页。有什么办法可以将整张 table 变成一个汤对象吗?目前我的代码是这样的: seasonStats
我正在尝试从 espn 网站上抓取一个表格。我似乎无法找到正确的名称来访问它。 url="https://www.espn.com/nba/stats/player/_/table/offensive
我正在尝试使用 Python 和 Selenium 对我梦幻足球队的选秀前策略页面中的球员进行重新排序。登录并进入页面没问题,但尝试交换播放器会导致一些问题。 到目前为止,我使用了以下代码但没有成功:
已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。 我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题,以便
我正在尝试抓取新的 ESPN NBA 记分牌。这是一个简单的脚本,它应该返回 2015 年 4 月 5 日所有比赛的开始时间: import requests import lxml.html fro
编辑 - 我最近在 Git 上发布了一个关于如何解决这个问题的教程......下面是一个链接 https://github.com/lukejgeger/ESPN-API-Example.git 我正
因此,我正在尝试在 ESPN 梦幻足球的 HTML 精简版选秀页面中编写一个 Hook ,以交叉引用球员排名列表(来自 CSV 文件),以从可用池中消除已经选秀的球员。我过去曾手动完成此操作:但是在最
我有一个与 espn Fantasy Football 相关的宠物项目。我的联盟是私有(private)的,它要求我登录该网站才能导航到该页面。例如,当我转到 时在浏览器上 http://games.
我是一名优秀的程序员,十分优秀!