gpt4 book ai didi

python - 如何使用 BeautifulSoup 找到评论标签 <!--...-->?

转载 作者:IT老高 更新时间:2023-10-28 21:11:55 24 4
gpt4 key购买 nike

我尝试了 soup.find('!--') 但它似乎不起作用。提前致谢。

编辑:感谢您提供有关如何查找所有评论的提示。我有一个后续问题。我如何专门搜索评论?

例如,我有以下评论标签:

<!-- <span class="titlefont"> <i>Wednesday 110518</i>(05:00PM)<br /></span> -->

我真的只是想要这些东西<i>Wednesday 110518</i> . “110518”是我倾向于用作搜索目标的日期 YYMMDD。但是,我不知道如何在特定的评论标签中找到一些东西。

最佳答案

您可以通过 findAll 方法找到文档中的所有注释。看这个例子,展示如何做你想做的事Removing elements :

简而言之,你想要这个:

comments = soup.findAll(text=lambda text:isinstance(text, Comment))

编辑:如果您尝试在列中搜索,您可以尝试:

import re
comments = soup.findAll(text=lambda text:isinstance(text, Comment))
for comment in comments:
e = re.match(r'<i>([^<]*)</i>', comment.string).group(1)
print e

关于python - 如何使用 BeautifulSoup 找到评论标签 &lt;!--...-->?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6062210/

24 4 0