gpt4 book ai didi

python - 如何提取div中的特定链接?

转载 作者:行者123 更新时间:2023-11-28 20:07:24 25 4
gpt4 key购买 nike

我有一个 soup内容如下许多<div> ,我感兴趣的是那些有 foo 类的人

在每个<div> ,有很多链接和其他内容,我对第二个链接感兴趣(第二个 <a> </a> )=> 总是第二个

我想获取href的值属性和第二个链接标签之间的文本 <a> </a>

例如:

<div class ="foo">
<a href ="http://example.com"> </a>
<a href ="http://example2.com"> Title here </a>
</div>

<div class ="foo">
<a href ="http://example3.com"> </a>
<a href ="http://example4.com"> Title 2 here </a>
</div>

这里我想得到:

标题在这里=> http://example2.com

此处为标题 2 => http://example4.com

我试过写一些代码:

soup.findAll("div", { "class" : "foo" })

但这会返回一个包含所有 div 及其内容的列表,我不知道如何进一步

谢谢:)

最佳答案

迭代 div 并在那里找到 a

from bs4 import BeautifulSoup

example = '''
<div class ="foo">
<a href ="http://example.com"> </a>
<a href ="http://example2.com"> Title here </a>
</div>

<div class ="foo">
<a href ="http://example3.com"> </a>
<a href ="http://example4.com"> Title 2 here </a>
'''

soup = BeautifulSoup(example)
for div in soup.findAll('div', {'class': 'foo'}):
a = div.findAll('a')[1]
print a.text.strip(), '=>', a.attrs['href']

关于python - 如何提取div中的特定链接?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17763542/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com