gpt4 book ai didi

python - 在 Python 中使用 BeautifulSoup 解析 标签并打印元素

转载 作者:行者123 更新时间:2023-11-30 22:59:38 25 4
gpt4 key购买 nike

我是 Python 新手,目前正在致力于解决问题以提高我的编码技能。我已经使用 python 提交了一个表单,从提交表单后显示的下一页开始,我想收集一些数据并将其显示在我的输出中。我想要收集的所需数据在<TR> </TR>之间标签,有很多<TR> </TR>就像那个页面上的那样。

供您引用:

<TR class="even"><TD class="id">6422275</TD><TD class="date"><NOBR>09:06:49</NOBR><BR><NOBR>27 Feb 2016</NOBR></TD><TD class="coder"><A HREF="author.aspx?id=201837">THE_ROCK</A></TD><TD class="problem"><A HREF="problem.aspx?space=1&amp;num=1000">1000<SPAN CLASS="problemname">. A+B Problem</SPAN></A></TD><TD class="language">Python 2.7</TD><TD class="verdict_ac">Accepted</TD><TD class="test"><BR></TD><TD class="runtime">0.015</TD><TD class="memory">160 KB</TD></TR>

因此,从整个 HTML 页面中,我想读取名称 THE_ROCK (它存在于上面的给定标签中),如果该页面中存在该内容,我想打印该特定 <TR> </TR> 中的完整元素(如问题、问题名称、verdict_ac、运行时和内存)标签。我明白我可以使用 BeautifulSoup但我不知道如何比较东西并打印特别需要的元素/标签。

代码:

res = br.submit()
final_url = res.geturl()
html_doc = br.open(final_url)
html_read = (html_doc.read())
soup = BeautifulSoup(data, convertEntities=BeautifulSoup.HTML_ENTITIES)
for row in soup.find_all('TR'):
print '\n'.join(row.stripped_strings)

我正在尝试查找 TR标签,但它没有帮助,并且没有打印任何输出。有人可以告诉我我哪里做错了吗?是我的方法不对还是流程不对?您能告诉我为什么我无法获得预期的输出吗?提前致谢。任何帮助将不胜感激。

最佳答案

通过文本查找元素并使用 find_parent() 找到 tr 父元素:

tr = soup.find(text="THE_ROCK").find_parent("tr")

关于python - 在 Python 中使用 BeautifulSoup 解析 <TR> </TR> 标签并打印元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35665851/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com