gpt4 book ai didi

python - 如何删除显示在表格行中的标题?

转载 作者:行者123 更新时间:2023-11-28 00:47:47 25 4
gpt4 key购买 nike

我正在寻找一种方法来删除所有出现在表格行中的 html 类“thead”的重复标题。这是我遇到问题之前的代码:

for yr in years:  
try:
url = 'https://www.pro-football-reference.com/years/' + yr + '/passing.htm'
html = urlopen(url)

soup = BeautifulSoup(html, "lxml")
column_headers = [th.getText() for th in soup.findAll('tr', limit=2)[0].findAll('th')]
table_rows = soup.select("#passing tr")[1:]

最佳答案

因为你想要的标签没有任何类,而你不想要的标签有以下标签:

<tr class="thead">

你可以简单地使用它来获取你想要的所有行:

table_rows = soup.find('table', id='passing').find_all('tr', class_=None)[1:]

使用 class_=None 将跳过所有具有任何类名的标签。

关于python - 如何删除显示在表格行中的标题?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49502679/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com