gpt4 book ai didi

python - 使用 beautifulsoup 在定义的范围内查找标签

转载 作者:太空宇宙 更新时间:2023-11-04 09:14:27 24 4
gpt4 key购买 nike

我使用 beautifulsoup 来提取数据。

我有这样一个html文件:

<div class=a>
<a href='google.com'>a</a>
</div>
<div class=b>
<a href='google.com'>c</a>
<a href='google.com'>d</a>
</div>

我想提取数据'c,d',我不需要数据'a'

我也是这样的:

google_list = soup.findAll('a',href='google.com')
for item in google_list:
print item.strings

它将打印 a,c,d。所以我的问题是如何只打印 'c','d' 而没有 'a' in

最佳答案

您可以只根据类别为 bdiv 进行选择,然后在 那个标签 上使用您的原始查询,这样您寻找它的 child :

div = soup.find_all('div', {"class":"b"})[0]
items = div.find_all('a', href="google.com")

关于python - 使用 beautifulsoup 在定义的范围内查找标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11271832/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com