gpt4 book ai didi

python - 为什么这个 BeautifulSoup 代码输出 "None"?

转载 作者:太空宇宙 更新时间:2023-11-03 18:55:09 25 4
gpt4 key购买 nike

import urllib2
from BeautifulSoup import BeautifulSoup

contenturl = "http://espnfc.com/tables/_/league/esp.1/spanish-la-liga?cc=5901"
soup = BeautifulSoup(urllib2.urlopen(contenturl).read())

table = soup.find('div id', attrs={'class': 'content'})

rows = soup.findAll('tr')
for tr in rows:
cols = tr.findAll('td')
for td in cols:
text = td.find(text=True)
print text,
print

我得到:(注意这只是我正在寻找的一小部分,这是足球联赛的排名)

  Overall None Home None Away None  
POS None TEAM P W D L F A None W D L F A None W D L F A None GD Pts
1
Barcelona 38 32 4 2 115 40 None 18 1 0 63 15 None 14 3

我的问题是,为什么每个字后面都有一个“无”?有什么办法可以让它停止这样做吗?

最佳答案

如果您在网站上注意到,一些信息之间有空格,并且这些信息包含在每个 td 中。

您可能会注意到所有空格都有宽度。所以,你可以这样做:

cols = tr.findAll('td', width=None)

如果您决定在任何阶段切换到 BeautifulSoup 4,请使用:

cols = tr.findAll('td', width=False)

关于python - 为什么这个 BeautifulSoup 代码输出 "None"?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17437896/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com