gpt4 book ai didi

html - BeautifulSoup 仅解析一列而不是 Python 中的整个维基百科表

转载 作者:太空宇宙 更新时间:2023-11-04 14:09:31 25 4
gpt4 key购买 nike

我正在尝试解析位于 here 的第一个表在 Python 中使用 BeautifulSoup。它解析了我的第一列,但由于某种原因它没有解析整个表。感谢您的帮助!

注意:我正在尝试解析整个表并转换为 pandas 数据框

我的代码:

import requests
from bs4 import BeautifulSoup

WIKI_URL = requests.get("https://en.wikipedia.org/wiki/NCAA_Division_I_FBS_football_win-loss_records").text
soup = BeautifulSoup(WIKI_URL, features="lxml")
print(soup.prettify())
my_table = soup.find('table',{'class':'wikitable sortable'})
links=my_table.findAll('a')
print(links)

最佳答案

它只解析了一列,因为您只对第一列中的项目进行了查找。要解析整个表,您必须对表行进行查找 <tr>然后在表的每一行中查找所有 <td> .现在您只是对链接进行查找,然后打印链接。

my_table = soup.find('table',{'class':'wikitable sortable'})
for row in mytable.findAll('tr'):
print(','.join([td.get_text(strip=True) for td in row.findAll('td')]))

关于html - BeautifulSoup 仅解析一列而不是 Python 中的整个维基百科表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54293938/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com