gpt4 book ai didi

python - 使用 BeautifulSoup 检查 html 页面是否不包含特定字符串

转载 作者:行者123 更新时间:2023-11-30 22:33:00 24 4
gpt4 key购买 nike

我知道可以使用findAll函数使用BeautifulSoup在html页面中查找字符串。例如,如果目标是 BeautifulSoup 站点:

page = urllib2.urlopen('https://www.crummy.com/software/BeautifulSoup/bs4/doc/')

soup = BeautifulSoup(page, "html.parser")

print soup.findAll(text="python")

结果将是:

[u'python']

但是我如何检查是否没有发生任何情况?是否可以得到 bool 结果?

最佳答案

空列表的计算结果为 False ,因此您可以只使用 if 语句,例如:

if soup.findAll(text="python") :  

或者,如果您想更明确,您可以使用 bool 并将其转换为 bool 值

bool(soup.findAll(text="python"))  

如果 text 不包含某些字符串,您还可以在 find_all 中使用 lambda 来收集标签

soup.find_all(lambda tag: "python" not in tag.text)  

或者,如果您想检查 soup 中的所有 NavigableString 是否不包含特定字符串,请使用:

all("python" not in s for s in soup.strings)

关于python - 使用 BeautifulSoup 检查 html 页面是否不包含特定字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45288984/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com