gpt4 book ai didi

python bs4 scrape table 得到错误的结果

转载 作者:太空宇宙 更新时间:2023-11-03 14:36:31 25 4
gpt4 key购买 nike

我正在尝试抓取此网站:http://stcw.marina.gov.ph/find/?c_n=14-111112&opt=stcw并得到底部的 table 。当我尝试抓取它时,我得到了第一行的一些元素,但没有从表的其余部分得到任何内容。这是我的代码

urlText = "http://stcw.marina.gov.ph/find/?c_n=14-111112&opt=stcw"
url = urlopen(urlText)
soup = bs.BeautifulSoup(url,"html.parser")
certificates = soup.find('table',class_='table table-bordered')
for row in certificates.find_all('tr'):
for td in row.find_all('td'):
print td.text

我得到的输出是:

22-20353

SHIP SECURITY OFFICER

而不是整个表。我缺少什么?

最佳答案

这是 underlying parser makes a difference 的又一个例子。 。切换到 lxmlhtml5lib 查看解析的完整表格:

soup = bs.BeautifulSoup(url, "lxml")
soup = bs.BeautifulSoup(url, "html5lib")

关于python bs4 scrape table 得到错误的结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46896276/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com