gpt4 book ai didi

python - 如何使用 beautifulSoup 访问跨度?

转载 作者:行者123 更新时间:2023-11-28 21:58:38 24 4
gpt4 key购买 nike

我想获取嵌套标签中的数字。我该怎么做?

我的代码输出这个,但我想得到#40,而不是整两行:

<span class="rankings-score">
<span>#40</span>

这是我的代码:

from bs4 import BeautifulSoup
import requests
import csv

site = "http://www.usnews.com/education/best-high-schools/national-rankings/page+2"

fields = ['national_rank','school','address','school_page','medal','ratio','size_desc','students','teachers']

r = requests.get(site)
html_source = r.text
soup = BeautifulSoup(html_source)

table = soup.find('table')
rows_list = []

for row in table.find_all('tr'):

d = dict()

d['national_rank'] = row.find("span", 'rankings-score')
print d['national_rank']

我收到这个错误:

AttributeError: 'NoneType' object has no attribute 'span'

当我尝试这样做时:

d['national_rank'] = row.find("span", 'rankings-score').span.text

最佳答案

访问嵌套跨度的文本:

score_span = row.find("span", 'rankings-score')
if score_span is not None:
print score_span.span.text

您需要确保 row.find("span", 'rankings-score')确实找到了一些东西;上面我测试了确实是一个<span>找到了。

.find()方法返回 None如果没有找到匹配的对象,那么一般来说,每当你得到一个 AttributeError: 'NoneType' object has no attribute ...异常,涉及您尝试使用 Element.find() 加载的对象, 那么你需要测试 None 尝试进一步访问信息之前。

这适用于 object.find , object.find_all , object[...]标签属性访问,object.<tagname> , object.select等等等等

关于python - 如何使用 beautifulSoup 访问跨度?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17885087/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com